オープンソースLLMが2026年の企業AIを変える

2026.06.08

オープンソースLLMが2026年の企業AIを変える

2025年1月、中国のDeepSeekが公開したオープンソースAIモデルは「DeepSeekショック」と呼ばれ、業界に衝撃を与えた。OpenAIやAnthropicの有料APIに匹敵する性能を持ちながら、無料で使えるモデルが登場した——そう受け取った企業が多かった。

しかし1年後の2026年、DeepSeekの実態が明らかになるにつれて、企業の反応は変わり始めた。Feroot Securityの調査で、DeepSeekのWebフロントエンドに「中国のサーバーへデータを送信するコード」が発見されたと報告された。APIを通じて送信する情報——業務文書、顧客データ、社内ナレッジ——も同様のリスクを抱える。

これは「DeepSeekが危険だ」という話ではない。「誰のサーバーにデータが行くか」という問いが、2026年の企業AI戦略の中心に浮上した、という話だ。

この記事では、2026年のオープンソースLLM勢力図と、日本企業がどう使いこなすかを解説する。

2026年のオープンソースLLM勢力図

2025年は、オープンソースLLMがクローズドモデルとの性能差を急速に縮めた年だった。2026年に入り、特定のタスクではオープンソースモデルがGPT-4oを上回る事例も増えている。

主要モデルの現在地を整理する。

モデル	開発元	ライセンス	特徴
Llama 4	Meta	Meta独自（商用可）	マルチモーダル対応、MoEアーキテクチャ。2025年4月公開
DeepSeek V4	中国DeepSeek社	MIT	1.6Tパラメータ(49B有効)、コスト効率が極めて高い
Qwen3 235B	Alibaba	Apache 2.0	商用利用の制約が最も少ない。日本語性能も高い
Mistral Small 4	フランスMistral AI	Apache 2.0 / 商用版あり	欧州企業での採用が急増。GDPR対応が考慮された設計
LLM-jp-4	国立情報学研究所	研究・商用可	2026年4月公開。日本語MT-Benchでスコア7.82、GPT-4oの7.29を上回る（出典: NII, 2026年4月）

注目すべきは国産モデルの台頭だ。国立情報学研究所が2026年4月に公開したLLM-jp-4は、8Bベースモデルと32B-A3B MoEモデルからなり、日本語能力評価ベンチマークでGPT-4oを上回るスコアを記録した。日本語ビジネス文書の処理に特化したモデルが、プロプライエタリAPIと同等以上の性能を持ち始めている。

なぜ今オープンソースなのか — 3つの構造変化

性能が上がったからオープンソースを使う、という単純な話ではない。企業がオープンソースLLMへ移行する背景には、3つの構造的な変化がある。

図1: 企業がオープンソースLLMへ移行する3つの理由

① APIコスト圧縮

ChatGPTやClaudeのAPIを業務に組み込むと、利用量に応じてコストが膨らむ。社内の複数部門で本格的に使い始めると、月額数十万円〜数百万円規模になる企業も出てきた。オープンソースモデルを自社のクラウドやオンプレミス環境で動かせば、トークン単価は大幅に下がる。ただし、GPUサーバーの運用コストや技術者の工数は別途発生するため、単純な比較はできない。

② データ主権の確保

業界調査では、44%の企業がLLM導入の最大の懸念としてデータプライバシーを挙げている。財務データ、人事情報、顧客の個人情報、製品の設計データ——これらを外部APIに送信することへの経営判断は、法務・コンプライアンス部門が関与するようになっている。

オープンソースモデルを自社環境で動かせば、データは社外に出ない。金融・医療・政府系の規制業種では、このことが意思決定の最大の要因になっている。

③ ベンダーロックインからの解放

OpenAIのGPTシリーズは1年で数回の仕様変更があり、その都度アプリケーション側の修正が必要になるケースがあった。自社でモデルを保持していれば、アップデートのタイミングを自分たちでコントロールできる。「AIサービスの利用者」ではなく「AIの所有者」になる、という発想の転換だ。

「DeepSeekは無料で使える」の落とし穴

DeepSeekはオープンソース（MITライセンス）で公開されており、コードは誰でも取得・改変・商用利用できる。しかし「DeepSeekのチャットサービス」や「DeepSeekのAPI」を利用する場合は話が別だ。

Feroot Securityの調査では、DeepSeekのWebフロントエンドに中国のサーバーへデータを送信するコードの存在が報告された。DeepSeekのプライバシーポリシーも、すべてのデータが中国のサーバーに保存されることを明記している（出典: DeepSeek プライバシーポリシー, 2025年）。

つまり、「DeepSeekをオープンソースとして自社環境にデプロイする」のは安全だが、「DeepSeekのAPIやチャットサービスを使う」のはデータリスクがある、という構造だ。同じモデルでも使い方によってリスクが全く異なる。

中国発のモデル（DeepSeek, Qwen）を採用する場合は、ライセンス条項・輸出規制・自社のコンプライアンス要件・業界規制を法務部門と確認した上で、自社環境での運用に限定する形が現実的だ。

欧州企業の動き — データ主権先進国の戦略

欧州企業のAI戦略は、日本の数歩先を進んでいる。EU AI法の施行（2024年8月）とGDPRの厳格運用により、欧州では「データを国外に出さない」ことが法的要件になりつつある。

フランスのMistral AIが注目される背景には、こうした欧州の規制環境がある。フランス政府も国産LLMの開発を支援しており、「欧州AI主権」という言葉が政策文書に頻出するようになった。

ドイツの金融機関では、生成AI基盤をAzure OpenAIから自社のプライベートクラウド上のMistralへ移行した事例がある。理由は「GDPR対応の確実性」だ。APIの性能差よりも、データの場所を完全に把握できることの方が重要と判断した。APIの回答品質を5%落としてでも、コンプライアンスリスクをゼロにする選択だ。

日本企業にとっての示唆は、「性能で選ぶ」から「ガバナンスで選ぶ」への転換だ。AIモデルを選ぶ基準が、ベンチマーク順位だけでなくデータの置き場所・ライセンスの透明性・長期的な運用コストに移ってきている。

オープンソースLLMの「隠れたコスト」

オープンソースだから「無料」という誤解は根強い。実際には以下のコストが発生する。

GPUインフラ費用: 7Bパラメータのモデルを実用レベルで動かすには、VRAM 16GB以上のGPUが必要。クラウドのGPUインスタンスは月数万〜数十万円。大きなモデルはさらに高額になる
運用・保守の工数: モデルのアップデート、セキュリティパッチ、スケーリングの管理が必要。専任エンジニアが必要になるケースも多い
ファインチューニングコスト: 自社データで精度を上げる場合、データ整備・学習・評価のサイクルに相当のコストがかかる
切り替えコスト: 既存のプロプライエタリAPIベースのアプリケーションからの移行には、コードの書き換えと動作確認が必要

APIコストと自社運用コストの損益分岐点は、月間利用量と社内のエンジニアリング能力によって大きく異なる。一般的に、月間APIコストが50万円を超えるような大規模利用であれば、自社運用が経済的に合理的になる。それ以下では、まだAPIの方が安い可能性が高い。

2028年へ向けた展望 — オープンとクローズドの帰着点

2028年時点で何が起きているかを予測する。

オープンソースLLMは性能面でクローズドモデルとの差がほぼなくなっている。今の差は「微妙な推論の精度」と「マルチモーダルの洗練度」に絞られており、これは2〜3年で縮まると考えている。

一方で、OpenAIやAnthropicのようなクローズドモデルは「最高性能の維持」より「統合された安全機能・ガバナンスツール・エンタープライズサポート」で差別化する方向に進む可能性が高い。AIを使う側が「モデルの性能」より「AIシステム全体の信頼性と監査可能性」を求めるようになるからだ。

結局、企業のAI戦略は「オープンソースかクローズドか」の二択ではなく、「コアとなる自社AIは内製・管理し、フロンティア技術が必要な領域は最高品質のAPIを使う」というハイブリッド体制に落ち着く。

Lat91でも現在、Claude APIを中心に使いながら、特定の社内業務では自社環境のLLMに移行する判断を始めている。API依存度を下げることがリスク管理であり、長期的なAI戦略の自律性につながると考えているからだ。

日本企業へのアドバイス — 今すぐできる3つの判断

判断1: 社内データをどこまで外部APIに渡しているか棚卸しする
どのAPIに何のデータを送っているかを部門ごとに整理する。機密性の高いデータが無防備に外部に出ているケースが見つかることが多い。

判断2: AIコストの増加予測を立てる
現在の月間API利用コストと、今後の利用拡大計画を照らし合わせ、1〜2年後のコスト予測を作る。50万円を超えそうなら、オープンソースへの移行コスト計算を今から始める価値がある。

判断3: 小規模なテストから始める
全面移行は不要だ。1つの社内ツールや1業務に限定して、オープンソースモデルを試す。性能・コスト・運用負荷を数値で比較してから判断する。Llama 4やQwen3はOllamaを使えばローカルPCでも動く。

まとめ

2026年はオープンソースLLMの性能がプロプライエタリAPIと並び始め、「データ主権」「コスト管理」「ベンダー独立」の観点から企業の選択肢が広がった
「DeepSeekは無料」は不正確だ。オープンソースとして自社環境で動かすことと、DeepSeekのサービスを使うことは全く異なるリスク構造を持つ
欧州企業は規制対応としてデータ主権を確立している。日本企業にとっても同様の判断が近づいている
オープンソースLLMは無料ではない。インフラ・運用・移行のコストを正確に把握した上で意思決定する
2028年の帰着点は、コアは内製・フロンティア領域はAPIのハイブリッド体制になる

「オープンソースvsクローズド」という対立軸は、本質的な問いではない。「どのデータをどのモデルに任せ、誰がそのリスクを管理するか」を設計することが、2026年以降の企業AI戦略の核心だ。

Lat91では、企業のAI活用戦略の設計から技術選定・導入支援まで一気通貫で支援しています。

「自社のAI戦略をどう設計すべきかわからない」という方は、まずは無料相談からお気軽にどうぞ。

無料相談はこちら

AI活用

RAGとは何か：社内データをAIの記憶に変える技術

AI活用

オープンソースLLMが2026年の企業AIを変える

オープンソースLLMが2026年の企業AIを変える

2026年のオープンソースLLM勢力図

なぜ今オープンソースなのか — 3つの構造変化

① APIコスト圧縮

② データ主権の確保

③ ベンダーロックインからの解放

「DeepSeekは無料で使える」の落とし穴

欧州企業の動き — データ主権先進国の戦略

オープンソースLLMの「隠れたコスト」

2028年へ向けた展望 — オープンとクローズドの帰着点

日本企業へのアドバイス — 今すぐできる3つの判断

まとめ

Related Articles

RAGとは何か：社内データをAIの記憶に変える技術

2026年後半AIトレンド：中小企業が備える3つの構造変化