「ChatGPTを全社員に使わせたら、月間APIコストが想定の5倍になった」——そういう相談がLat91に届く頻度が、2025年後半から増えている。
生成AIを本格導入した企業が次に直面するのは、コストと統制の問題だ。社外にデータを送れない、クラウドAPIへの依存がリスクになる、予測不能な課金が経営を圧迫する。
この問題の解決策として急速に注目を集めているのが、SLM(Small Language Model、小型言語モデル)だ。「LLMより小さくて安い」という説明をよく見るが、それは本質の半分しか伝えていない。
SLMが重要なのは、特定の業務タスクでGPT-4を超える精度が出るからだ。セキュリティ脆弱性の検出では、ファインチューニングしたSLMがGPT-4oに17ポイント差をつけた(arXiv, 2025)。同じコストで、より速く、より正確に動く用途が、企業業務には無数にある。
この記事では、SLMとは何か、LLMとの本質的な違い、どの業務に向いているかを解説する。正しい使い分けを理解すれば、AIコストを最大70%削減しながら必要な精度を維持できる。
SLMとは何か — パラメータ数の意味
SLMに統一された定義はないが、おおよそ「100億(10B)パラメータ以下」の言語モデルを指す。GPT-4が推定1.8兆パラメータ、Claude 3 Opusが数千億パラメータとされるのに対し、SLMはその1/100〜1/10,000の規模だ。
サイズが小さいと性能も劣る——2023年時点ではその認識はほぼ正しかった。だが2024〜2026年にかけて「知識の蒸留(ディスティレーション)」技術が急進歩した。大きなモデルが学習した知識を、小さなモデルに圧縮転写する技術だ。
今では4GBのRAMで動く4BパラメータのSLMが、3年前のGPT-3レベルの推論能力を持つ。クラウド不要、オフラインで動作する。
代表的なSLMモデル(2026年時点)
- Microsoft Phi-4(14B) — 数学的推論でGPT-4oと同等(GSM8KベンチマークでPhi-4が93.7%)。文書処理と構造化データ抽出に強い
- Google Gemma 3(4B・12B・27B) — 20以上の言語に対応。4BモデルがRAM 4.2GBで動作。画像入力にも対応
- Meta Llama 3.2(1B・3B・11B) — オープンウェイト(重みを公開)。エッジデバイスへの展開に適している
- TinySwallow-1.5B(Sakana AI) — 日本語特化の国産SLM。32Bモデルから蒸留した日本語対応モデル。オンプレミスで動作
LLMとの本質的な違い
パラメータ数の差は、そのまま「汎用性 vs 専門性」のトレードオフに対応する。
図1: LLMとSLMの主要特性比較
この表で最も重要なのは最後の行だ。「汎用的に高い」と「チューニングで上回れる」の違いを理解することが、SLM活用の出発点になる。
SLMが有利な5つの業務用途
SLMは「何でも答えてくれる」ツールではない。だが、以下の用途では大規模LLMより確実に有利だ。
1. 文書分類・ラベリング
メールを「問い合わせ/クレーム/注文確認」に分ける、契約書から期日を抽出する——こういった反復的な分類タスクはSLMの独壇場だ。データを1,000件揃えてファインチューニングすれば、GPT-4oと同等以上の精度が数十分の1のコストで出る。
2. 社内専門用語を含む問い合わせ対応
自社製品のFAQ、規程・マニュアルの質問応答——GPT-4は社内独自用語を知らないため、曖昧な回答になりやすい。SLMを社内データでファインチューニングすれば、「うちの会社の言葉」で答えるAIになる。カスタマーサポートチームの定型問い合わせ対応の8割を自動化した企業もある(出典: Red Hat, 2025)。
3. 個人情報・機密情報を含む処理
患者データ、財務情報、人事評価——外部APIに送れない情報はどんな企業にも存在する。SLMはオンプレミスに閉じて動作するため、HIPAA(米国医療情報保護法)やGDPRへの対応が格段にシンプルになる。米国の医療機関でMicrosoft PHI-3を院内サーバーに展開し、患者問い合わせ対応を自動化した事例では、コンプライアンスを維持したまま応答時間を大幅に短縮した。
4. 高頻度・大量バッチ処理
1日100万件の領収書OCRと分類、1秒ごとの異常ログ検出——大量処理ではAPI料金が指数関数的に増える。SLMをオンプレミスに置けば、処理件数が増えても追加コストはほぼゼロだ。ある企業では合成データ生成タスクをSLMに切り替えたことで、GPT-4o比で8,000ドル以上のコストを削減した(出典: iterathon.tech, 2026)。
5. エージェントの「軽い判断」
AIエージェントは複数のLLM呼び出しで動く。その全ステップにGPT-4を使う必要はない。「次はどのツールを呼ぶか判断する」といった軽い推論ステップにSLMを使い、複雑な判断だけLLMに渡すハイブリッド構成が、2026年のエージェント設計のトレンドになっている。Lat91では、10体のエージェントチームの中で「ルーティング判断」や「情報抽出」のステップにSLMを活用し、コストを月30〜40%削減している。
海外での実装事例
米国の医療機関では、Epic(電子カルテ大手)と統合したPHI-3をオンプレミス展開し、患者からの定型問い合わせに24時間対応するシステムを構築した。患者データは一切外部に出ない設計で、HIPAAに完全準拠。GPT-4ベースのシステムと比べてAPI料金がゼロになり、応答速度は5倍に向上した。
コード脆弱性の検出に特化したSLM(CWE検出タスク)では、ファインチューニング済みモデルがGPT-4oの79%に対して96%のF1スコアを達成した(arXiv, 2025)。「汎用モデルが一番賢い」という前提が崩れた象徴的な事例だ。
SLM市場全体の規模は2025年で9.3億ドル、2032年には54.5億ドルに達すると予測されており、年平均成長率28.7%で拡大中だ(出典: 市場調査, 2025)。
日本企業への展開 — TinySwallowが示すもの
日本語SLMの状況は、2024年から急速に改善している。Sakana AIが開発したTinySwallow-1.5Bは、32Bモデルから蒸留した日本語特化SLMで、1.5Bのパラメータながら日本語ビジネス文書の処理に実用的な精度を持つ。
NTTグループの独自LLM(tsuzumi)も、軽量版は数Bパラメータのオンプレミス対応モデルとして企業向けに提供されている。「データを外に出せない」という日本企業の文化的・法的要件に対応した動きだ。
特に金融・医療・法務・人事の分野では、SLMのオンプレミス活用が今後の主流になる可能性が高い。クラウドAIの「データが外に出る」リスクを嫌う経営判断が、SLM採用の現実的な動機になっている。
SLMの正直な限界
「SLMさえあればLLMは不要」という主張は誇大だ。SLMが苦手なことを正直に書く。
まず、複雑な多段階推論が苦手だ。「この企業のM&A可否を財務・法務・市場の観点から総合判断せよ」といった複合的な問いには、やはり大規模LLMが必要になる。
次に、未知のドメインへの適応が弱い。ファインチューニングされていない領域では、GPT-4の汎用性に及ばない。「とりあえず質問を投げれば何かしら答えてくれる」という使い方には向かない。
そして、クリエイティブな文章生成では差がある。マーケティングコピーや複雑なレポートの執筆には、今のところ大規模LLMの方が品質が高い。
どちらを選ぶか — 判断の基準
図2: タスク特性によるLLM/SLM選択マトリクス
右側の「反復・単純」タスクがSLMの主戦場だ。繰り返しが多く、答えのパターンが決まっているタスクほど、専用SLMのコストパフォーマンスは上がる。
2028年に向けての展望
Gartnerは「2028年までに、コンテキストエンジニアリングが80%以上のソフトウェアツールに組み込まれる」と予測している。この流れの中で、SLMはエッジAIの中核として、IoTデバイスからスマートフォンまで組み込まれていく。
特に注目すべきは「デバイス上で動くAI」の普及だ。Appleはすでに iPhone 上でSLMを動作させる技術を製品化している。製造現場の品質検査デバイス、医療診断補助ツール、現場作業員のスマートフォン——全部オフラインで動く産業AIが、5年以内に当たり前になる可能性がある。
今週から試せること
- Ollama(ollama.ai)をローカルPCにインストールし、Llama 3.2 3Bを動かしてみる(無料・5分で完了)
- 自社のよく来るFAQ問い合わせを20〜50件洗い出し、「SLMで自動化できるか」を判断する
- 現在GPT-4を使っているタスクをリストアップし、「毎回同じパターンのタスク」を特定する——それがSLMへの移行候補
まとめ
- SLMは「安いLLM」ではなく「特定業務に特化した企業専用AIツール」。正しく使えばGPT-4より高精度になる
- 文書分類・定型抽出・オンプレ処理・エージェント内の軽い判断、これらがSLMの主戦場
- コストは大規模LLMの1/10〜1/30。日本語SLM(TinySwallow等)も実用段階に入っている
- 複雑な創造的タスクにはLLMが必要。「全部SLMで置き換える」は現実的ではない
- 2028年に向けて、エッジデバイス組み込みSLMが産業AIの中核になる
Lat91では、AIエージェント設計においてLLMとSLMのハイブリッド活用を標準として構築・運用しています。
「APIコストが想定より高い」「社内データをクラウドに送れない」という課題をお持ちの方は、まず無料相談でご状況をお聞かせください。御社のユースケースに合ったモデル選定から設計をご提案します。