オープンソースLLMが2026年の企業AIを変える
2025年1月、中国のDeepSeekが公開したオープンソースAIモデルは「DeepSeekショック」と呼ばれ、業界に衝撃を与えた。OpenAIやAnthropicの有料APIに匹敵する性能を持ちながら、無料で使えるモデルが登場した——そう受け取った企業が多かった。
しかし1年後の2026年、DeepSeekの実態が明らかになるにつれて、企業の反応は変わり始めた。Feroot Securityの調査で、DeepSeekのWebフロントエンドに「中国のサーバーへデータを送信するコード」が発見されたと報告された。APIを通じて送信する情報——業務文書、顧客データ、社内ナレッジ——も同様のリスクを抱える。
これは「DeepSeekが危険だ」という話ではない。「誰のサーバーにデータが行くか」という問いが、2026年の企業AI戦略の中心に浮上した、という話だ。
この記事では、2026年のオープンソースLLM勢力図と、日本企業がどう使いこなすかを解説する。
2026年のオープンソースLLM勢力図
2025年は、オープンソースLLMがクローズドモデルとの性能差を急速に縮めた年だった。2026年に入り、特定のタスクではオープンソースモデルがGPT-4oを上回る事例も増えている。
主要モデルの現在地を整理する。
| モデル | 開発元 | ライセンス | 特徴 |
|---|---|---|---|
| Llama 4 | Meta | Meta独自(商用可) | マルチモーダル対応、MoEアーキテクチャ。2025年4月公開 |
| DeepSeek V4 | 中国DeepSeek社 | MIT | 1.6Tパラメータ(49B有効)、コスト効率が極めて高い |
| Qwen3 235B | Alibaba | Apache 2.0 | 商用利用の制約が最も少ない。日本語性能も高い |
| Mistral Small 4 | フランスMistral AI | Apache 2.0 / 商用版あり | 欧州企業での採用が急増。GDPR対応が考慮された設計 |
| LLM-jp-4 | 国立情報学研究所 | 研究・商用可 | 2026年4月公開。日本語MT-Benchでスコア7.82、GPT-4oの7.29を上回る(出典: NII, 2026年4月) |
注目すべきは国産モデルの台頭だ。国立情報学研究所が2026年4月に公開したLLM-jp-4は、8Bベースモデルと32B-A3B MoEモデルからなり、日本語能力評価ベンチマークでGPT-4oを上回るスコアを記録した。日本語ビジネス文書の処理に特化したモデルが、プロプライエタリAPIと同等以上の性能を持ち始めている。
なぜ今オープンソースなのか — 3つの構造変化
性能が上がったからオープンソースを使う、という単純な話ではない。企業がオープンソースLLMへ移行する背景には、3つの構造的な変化がある。
図1: 企業がオープンソースLLMへ移行する3つの理由
① APIコスト圧縮
ChatGPTやClaudeのAPIを業務に組み込むと、利用量に応じてコストが膨らむ。社内の複数部門で本格的に使い始めると、月額数十万円〜数百万円規模になる企業も出てきた。オープンソースモデルを自社のクラウドやオンプレミス環境で動かせば、トークン単価は大幅に下がる。ただし、GPUサーバーの運用コストや技術者の工数は別途発生するため、単純な比較はできない。
② データ主権の確保
業界調査では、44%の企業がLLM導入の最大の懸念としてデータプライバシーを挙げている。財務データ、人事情報、顧客の個人情報、製品の設計データ——これらを外部APIに送信することへの経営判断は、法務・コンプライアンス部門が関与するようになっている。
オープンソースモデルを自社環境で動かせば、データは社外に出ない。金融・医療・政府系の規制業種では、このことが意思決定の最大の要因になっている。
③ ベンダーロックインからの解放
OpenAIのGPTシリーズは1年で数回の仕様変更があり、その都度アプリケーション側の修正が必要になるケースがあった。自社でモデルを保持していれば、アップデートのタイミングを自分たちでコントロールできる。「AIサービスの利用者」ではなく「AIの所有者」になる、という発想の転換だ。
「DeepSeekは無料で使える」の落とし穴
DeepSeekはオープンソース(MITライセンス)で公開されており、コードは誰でも取得・改変・商用利用できる。しかし「DeepSeekのチャットサービス」や「DeepSeekのAPI」を利用する場合は話が別だ。
Feroot Securityの調査では、DeepSeekのWebフロントエンドに中国のサーバーへデータを送信するコードの存在が報告された。DeepSeekのプライバシーポリシーも、すべてのデータが中国のサーバーに保存されることを明記している(出典: DeepSeek プライバシーポリシー, 2025年)。
つまり、「DeepSeekをオープンソースとして自社環境にデプロイする」のは安全だが、「DeepSeekのAPIやチャットサービスを使う」のはデータリスクがある、という構造だ。同じモデルでも使い方によってリスクが全く異なる。
中国発のモデル(DeepSeek, Qwen)を採用する場合は、ライセンス条項・輸出規制・自社のコンプライアンス要件・業界規制を法務部門と確認した上で、自社環境での運用に限定する形が現実的だ。
欧州企業の動き — データ主権先進国の戦略
欧州企業のAI戦略は、日本の数歩先を進んでいる。EU AI法の施行(2024年8月)とGDPRの厳格運用により、欧州では「データを国外に出さない」ことが法的要件になりつつある。
フランスのMistral AIが注目される背景には、こうした欧州の規制環境がある。フランス政府も国産LLMの開発を支援しており、「欧州AI主権」という言葉が政策文書に頻出するようになった。
ドイツの金融機関では、生成AI基盤をAzure OpenAIから自社のプライベートクラウド上のMistralへ移行した事例がある。理由は「GDPR対応の確実性」だ。APIの性能差よりも、データの場所を完全に把握できることの方が重要と判断した。APIの回答品質を5%落としてでも、コンプライアンスリスクをゼロにする選択だ。
日本企業にとっての示唆は、「性能で選ぶ」から「ガバナンスで選ぶ」への転換だ。AIモデルを選ぶ基準が、ベンチマーク順位だけでなくデータの置き場所・ライセンスの透明性・長期的な運用コストに移ってきている。
オープンソースLLMの「隠れたコスト」
オープンソースだから「無料」という誤解は根強い。実際には以下のコストが発生する。
- GPUインフラ費用: 7Bパラメータのモデルを実用レベルで動かすには、VRAM 16GB以上のGPUが必要。クラウドのGPUインスタンスは月数万〜数十万円。大きなモデルはさらに高額になる
- 運用・保守の工数: モデルのアップデート、セキュリティパッチ、スケーリングの管理が必要。専任エンジニアが必要になるケースも多い
- ファインチューニングコスト: 自社データで精度を上げる場合、データ整備・学習・評価のサイクルに相当のコストがかかる
- 切り替えコスト: 既存のプロプライエタリAPIベースのアプリケーションからの移行には、コードの書き換えと動作確認が必要
APIコストと自社運用コストの損益分岐点は、月間利用量と社内のエンジニアリング能力によって大きく異なる。一般的に、月間APIコストが50万円を超えるような大規模利用であれば、自社運用が経済的に合理的になる。それ以下では、まだAPIの方が安い可能性が高い。
2028年へ向けた展望 — オープンとクローズドの帰着点
2028年時点で何が起きているかを予測する。
オープンソースLLMは性能面でクローズドモデルとの差がほぼなくなっている。今の差は「微妙な推論の精度」と「マルチモーダルの洗練度」に絞られており、これは2〜3年で縮まると考えている。
一方で、OpenAIやAnthropicのようなクローズドモデルは「最高性能の維持」より「統合された安全機能・ガバナンスツール・エンタープライズサポート」で差別化する方向に進む可能性が高い。AIを使う側が「モデルの性能」より「AIシステム全体の信頼性と監査可能性」を求めるようになるからだ。
結局、企業のAI戦略は「オープンソースかクローズドか」の二択ではなく、「コアとなる自社AIは内製・管理し、フロンティア技術が必要な領域は最高品質のAPIを使う」というハイブリッド体制に落ち着く。
Lat91でも現在、Claude APIを中心に使いながら、特定の社内業務では自社環境のLLMに移行する判断を始めている。API依存度を下げることがリスク管理であり、長期的なAI戦略の自律性につながると考えているからだ。
日本企業へのアドバイス — 今すぐできる3つの判断
判断1: 社内データをどこまで外部APIに渡しているか棚卸しする
どのAPIに何のデータを送っているかを部門ごとに整理する。機密性の高いデータが無防備に外部に出ているケースが見つかることが多い。
判断2: AIコストの増加予測を立てる
現在の月間API利用コストと、今後の利用拡大計画を照らし合わせ、1〜2年後のコスト予測を作る。50万円を超えそうなら、オープンソースへの移行コスト計算を今から始める価値がある。
判断3: 小規模なテストから始める
全面移行は不要だ。1つの社内ツールや1業務に限定して、オープンソースモデルを試す。性能・コスト・運用負荷を数値で比較してから判断する。Llama 4やQwen3はOllamaを使えばローカルPCでも動く。
まとめ
- 2026年はオープンソースLLMの性能がプロプライエタリAPIと並び始め、「データ主権」「コスト管理」「ベンダー独立」の観点から企業の選択肢が広がった
- 「DeepSeekは無料」は不正確だ。オープンソースとして自社環境で動かすことと、DeepSeekのサービスを使うことは全く異なるリスク構造を持つ
- 欧州企業は規制対応としてデータ主権を確立している。日本企業にとっても同様の判断が近づいている
- オープンソースLLMは無料ではない。インフラ・運用・移行のコストを正確に把握した上で意思決定する
- 2028年の帰着点は、コアは内製・フロンティア領域はAPIのハイブリッド体制になる
「オープンソースvsクローズド」という対立軸は、本質的な問いではない。「どのデータをどのモデルに任せ、誰がそのリスクを管理するか」を設計することが、2026年以降の企業AI戦略の核心だ。
Lat91では、企業のAI活用戦略の設計から技術選定・導入支援まで一気通貫で支援しています。
「自社のAI戦略をどう設計すべきかわからない」という方は、まずは無料相談からお気軽にどうぞ。