SLMとは — 企業AIを変える小さな知性の実力

2026.06.10

「ChatGPTを全社員に使わせたら、月間APIコストが想定の5倍になった」——そういう相談がLat91に届く頻度が、2025年後半から増えている。

生成AIを本格導入した企業が次に直面するのは、コストと統制の問題だ。社外にデータを送れない、クラウドAPIへの依存がリスクになる、予測不能な課金が経営を圧迫する。

この問題の解決策として急速に注目を集めているのが、SLM（Small Language Model、小型言語モデル）だ。「LLMより小さくて安い」という説明をよく見るが、それは本質の半分しか伝えていない。

SLMが重要なのは、特定の業務タスクでGPT-4を超える精度が出るからだ。セキュリティ脆弱性の検出では、ファインチューニングしたSLMがGPT-4oに17ポイント差をつけた（arXiv, 2025）。同じコストで、より速く、より正確に動く用途が、企業業務には無数にある。

この記事では、SLMとは何か、LLMとの本質的な違い、どの業務に向いているかを解説する。正しい使い分けを理解すれば、AIコストを最大70%削減しながら必要な精度を維持できる。

SLMとは何か — パラメータ数の意味

SLMに統一された定義はないが、おおよそ「100億（10B）パラメータ以下」の言語モデルを指す。GPT-4が推定1.8兆パラメータ、Claude 3 Opusが数千億パラメータとされるのに対し、SLMはその1/100〜1/10,000の規模だ。

サイズが小さいと性能も劣る——2023年時点ではその認識はほぼ正しかった。だが2024〜2026年にかけて「知識の蒸留（ディスティレーション）」技術が急進歩した。大きなモデルが学習した知識を、小さなモデルに圧縮転写する技術だ。

今では4GBのRAMで動く4BパラメータのSLMが、3年前のGPT-3レベルの推論能力を持つ。クラウド不要、オフラインで動作する。

代表的なSLMモデル（2026年時点）

Microsoft Phi-4（14B） — 数学的推論でGPT-4oと同等（GSM8KベンチマークでPhi-4が93.7%）。文書処理と構造化データ抽出に強い
Google Gemma 3（4B・12B・27B） — 20以上の言語に対応。4BモデルがRAM 4.2GBで動作。画像入力にも対応
Meta Llama 3.2（1B・3B・11B） — オープンウェイト（重みを公開）。エッジデバイスへの展開に適している
TinySwallow-1.5B（Sakana AI） — 日本語特化の国産SLM。32Bモデルから蒸留した日本語対応モデル。オンプレミスで動作

LLMとの本質的な違い

パラメータ数の差は、そのまま「汎用性 vs 専門性」のトレードオフに対応する。

図1: LLMとSLMの主要特性比較

この表で最も重要なのは最後の行だ。「汎用的に高い」と「チューニングで上回れる」の違いを理解することが、SLM活用の出発点になる。

SLMが有利な5つの業務用途

SLMは「何でも答えてくれる」ツールではない。だが、以下の用途では大規模LLMより確実に有利だ。

1. 文書分類・ラベリング

メールを「問い合わせ/クレーム/注文確認」に分ける、契約書から期日を抽出する——こういった反復的な分類タスクはSLMの独壇場だ。データを1,000件揃えてファインチューニングすれば、GPT-4oと同等以上の精度が数十分の1のコストで出る。

2. 社内専門用語を含む問い合わせ対応

自社製品のFAQ、規程・マニュアルの質問応答——GPT-4は社内独自用語を知らないため、曖昧な回答になりやすい。SLMを社内データでファインチューニングすれば、「うちの会社の言葉」で答えるAIになる。カスタマーサポートチームの定型問い合わせ対応の8割を自動化した企業もある（出典: Red Hat, 2025）。

3. 個人情報・機密情報を含む処理

患者データ、財務情報、人事評価——外部APIに送れない情報はどんな企業にも存在する。SLMはオンプレミスに閉じて動作するため、HIPAA（米国医療情報保護法）やGDPRへの対応が格段にシンプルになる。米国の医療機関でMicrosoft PHI-3を院内サーバーに展開し、患者問い合わせ対応を自動化した事例では、コンプライアンスを維持したまま応答時間を大幅に短縮した。

4. 高頻度・大量バッチ処理

1日100万件の領収書OCRと分類、1秒ごとの異常ログ検出——大量処理ではAPI料金が指数関数的に増える。SLMをオンプレミスに置けば、処理件数が増えても追加コストはほぼゼロだ。ある企業では合成データ生成タスクをSLMに切り替えたことで、GPT-4o比で8,000ドル以上のコストを削減した（出典: iterathon.tech, 2026）。

5. エージェントの「軽い判断」

AIエージェントは複数のLLM呼び出しで動く。その全ステップにGPT-4を使う必要はない。「次はどのツールを呼ぶか判断する」といった軽い推論ステップにSLMを使い、複雑な判断だけLLMに渡すハイブリッド構成が、2026年のエージェント設計のトレンドになっている。Lat91では、10体のエージェントチームの中で「ルーティング判断」や「情報抽出」のステップにSLMを活用し、コストを月30〜40%削減している。

海外での実装事例

米国の医療機関では、Epic（電子カルテ大手）と統合したPHI-3をオンプレミス展開し、患者からの定型問い合わせに24時間対応するシステムを構築した。患者データは一切外部に出ない設計で、HIPAAに完全準拠。GPT-4ベースのシステムと比べてAPI料金がゼロになり、応答速度は5倍に向上した。

コード脆弱性の検出に特化したSLM（CWE検出タスク）では、ファインチューニング済みモデルがGPT-4oの79%に対して96%のF1スコアを達成した（arXiv, 2025）。「汎用モデルが一番賢い」という前提が崩れた象徴的な事例だ。

SLM市場全体の規模は2025年で9.3億ドル、2032年には54.5億ドルに達すると予測されており、年平均成長率28.7%で拡大中だ（出典: 市場調査, 2025）。

日本企業への展開 — TinySwallowが示すもの

日本語SLMの状況は、2024年から急速に改善している。Sakana AIが開発したTinySwallow-1.5Bは、32Bモデルから蒸留した日本語特化SLMで、1.5Bのパラメータながら日本語ビジネス文書の処理に実用的な精度を持つ。

NTTグループの独自LLM（tsuzumi）も、軽量版は数Bパラメータのオンプレミス対応モデルとして企業向けに提供されている。「データを外に出せない」という日本企業の文化的・法的要件に対応した動きだ。

特に金融・医療・法務・人事の分野では、SLMのオンプレミス活用が今後の主流になる可能性が高い。クラウドAIの「データが外に出る」リスクを嫌う経営判断が、SLM採用の現実的な動機になっている。

SLMの正直な限界

「SLMさえあればLLMは不要」という主張は誇大だ。SLMが苦手なことを正直に書く。

まず、複雑な多段階推論が苦手だ。「この企業のM&A可否を財務・法務・市場の観点から総合判断せよ」といった複合的な問いには、やはり大規模LLMが必要になる。

次に、未知のドメインへの適応が弱い。ファインチューニングされていない領域では、GPT-4の汎用性に及ばない。「とりあえず質問を投げれば何かしら答えてくれる」という使い方には向かない。

そして、クリエイティブな文章生成では差がある。マーケティングコピーや複雑なレポートの執筆には、今のところ大規模LLMの方が品質が高い。

どちらを選ぶか — 判断の基準

図2: タスク特性によるLLM/SLM選択マトリクス

右側の「反復・単純」タスクがSLMの主戦場だ。繰り返しが多く、答えのパターンが決まっているタスクほど、専用SLMのコストパフォーマンスは上がる。

2028年に向けての展望

Gartnerは「2028年までに、コンテキストエンジニアリングが80%以上のソフトウェアツールに組み込まれる」と予測している。この流れの中で、SLMはエッジAIの中核として、IoTデバイスからスマートフォンまで組み込まれていく。

特に注目すべきは「デバイス上で動くAI」の普及だ。Appleはすでに iPhone 上でSLMを動作させる技術を製品化している。製造現場の品質検査デバイス、医療診断補助ツール、現場作業員のスマートフォン——全部オフラインで動く産業AIが、5年以内に当たり前になる可能性がある。

今週から試せること

Ollama（ollama.ai）をローカルPCにインストールし、Llama 3.2 3Bを動かしてみる（無料・5分で完了）
自社のよく来るFAQ問い合わせを20〜50件洗い出し、「SLMで自動化できるか」を判断する
現在GPT-4を使っているタスクをリストアップし、「毎回同じパターンのタスク」を特定する——それがSLMへの移行候補

まとめ

SLMは「安いLLM」ではなく「特定業務に特化した企業専用AIツール」。正しく使えばGPT-4より高精度になる
文書分類・定型抽出・オンプレ処理・エージェント内の軽い判断、これらがSLMの主戦場
コストは大規模LLMの1/10〜1/30。日本語SLM（TinySwallow等）も実用段階に入っている
複雑な創造的タスクにはLLMが必要。「全部SLMで置き換える」は現実的ではない
2028年に向けて、エッジデバイス組み込みSLMが産業AIの中核になる

Lat91では、AIエージェント設計においてLLMとSLMのハイブリッド活用を標準として構築・運用しています。

「APIコストが想定より高い」「社内データをクラウドに送れない」という課題をお持ちの方は、まず無料相談でご状況をお聞かせください。御社のユースケースに合ったモデル選定から設計をご提案します。

無料相談はこちら

AI活用

RAGとは何か：社内データをAIの記憶に変える技術