コンテキストエンジニアリングとは:AIが成果を出せない本当の理由
「プロンプトを何度書き直しても、AIの精度が上がらない」——そんな経験が続いているなら、問題はプロンプトにはないかもしれない。
2025年後半から急速に注目を集める「コンテキストエンジニアリング」は、AIに渡す情報の全体を設計する技術だ。プロンプトの書き方ではなく、「AIが回答を生成する前に何を見ているか」を整備する営みと言えばわかりやすい。
DataHub社が2026年に実施した調査では、82%のITリーダーが「プロンプトエンジニアリングだけではAIをスケールさせるのに不十分」と回答した。そして95%のデータチームが同年中にコンテキストエンジニアリングへの投資を計画していると答えた(出典: DataHub, State of Context Management Report, 2026)。
この記事では、コンテキストエンジニアリングがプロンプト設計とどう違うのか、なぜ今重要なのか、そしてLat91が自社の10体AIエージェントチームを運用する中で学んだ実践知を解説する。
「プロンプトを改善したのに精度が上がらない」の正体
AIエージェントが誤作動したとき、最初に疑われるのはプロンプトだ。「もっと詳しく指示すればいい」「役割設定を変えよう」——こうした対症療法を繰り返しても、根本が変わらないことがある。
問題の核心は「コンテキストロット(Context Rot)」にある。
LLMはトランスフォーマーアーキテクチャの性質上、コンテキストウィンドウ内のすべてのトークン同士を比較しながら出力を生成する。情報量が増えるほど計算量は指数的に増加し、重要な情報が「見えにくく」なる。Chroma社が18種類の主要LLMを対象に行った調査では、すべてのモデルでコンテキスト量が増えるほど性能が低下するという結果が一貫して出た(出典: Chroma, LLM Context Length Study, 2025)。
「良い情報を加えれば精度が上がる」——この直感が、実は逆効果を招いている。これがコンテキストロットの逆説だ。
図1: コンテキスト量と精度の関係——最適な情報量は「多め」ではなく「高品質に絞ったもの」
プロンプトエンジニアリングとの違い
コンテキストエンジニアリングとプロンプトエンジニアリングは、よく混同される。整理すると次のように区別できる。
| 項目 | プロンプトエンジニアリング | コンテキストエンジニアリング |
|---|---|---|
| 対象 | システムプロンプト・ユーザー入力 | AIが参照するすべての情報 |
| 時間軸 | 1回の問いかけ | 複数ステップにわたるタスク全体 |
| 主な課題 | 「どう聞くか」 | 「何を見せるか・見せないか」 |
| 適用場面 | チャットボット・単発タスク | AIエージェント・長期タスク |
Anthropicはコンテキストエンジニアリングを「LLM推論の際に最適なトークンセットをキュレーションし、維持するための戦略群」と定義している(出典: Anthropic, Effective Context Engineering for AI Agents, 2026)。
プロンプトエンジニアリングが「AIへの問い方」を磨くなら、コンテキストエンジニアリングは「AIが問いに答える前に何を見ているか」を設計する。UIとUXの関係に近い。前者は表面の形を整え、後者はその背後にある体験全体を設計する。
なぜ今、これが重要なのか
シンプルなチャットAIであれば、1回の問いかけに1回答えれば済む。プロンプトの最適化で大半は解決できる。
ところが、複数のステップを経てタスクを実行するAIエージェントでは話が変わる。10ステップのタスクを実行するエージェントは、1ステップ目と10ステップ目で全く異なるコンテキストを持つ。各ステップで実行したツールの結果、取得したデータ、会話履歴——これらが積み重なり、コンテキストウィンドウを圧迫する。この変化を適切に管理しないと、後半のステップで精度が劣化する。
Anthropicは2026年時点のAIエージェント設計の実践知として、次の目標を提示している。「最小限のトークンセットで、望ましいアウトプットが得られる確率を最大化する」——これがコンテキストエンジニアリングの本質だ。
4つのコアテクニック
1. コンテキスト圧縮(Compaction)
蓄積した会話履歴を定期的に要約し、新しいセッションを圧縮済みのサマリーで再初期化する手法だ。「重要な決定・制約・根拠だけを保持し、それ以外を削除する」意思決定ログに変換する。
Lat91では、セッションが一定のトークン数を超えると、エージェントが自動的にサマリーを生成して引き継ぐ設計を採用している。これにより長時間タスクでも精度の劣化を防いでいる。
2. 構造化メモ(Structured Note-taking)
エージェントが外部ファイルに情報を書き出し、必要なときだけ読み込む手法だ。コンテキストウィンドウを「作業台」とすれば、構造化メモは「引き出し」に当たる。
具体的には、PROGRESS.md や NOTES.md のようなファイルをエージェントが能動的に管理する。セッションをまたいでも、このファイルを読めば前回の文脈を復元できる。
3. サブエージェント分割(Sub-agent Architecture)
一つのエージェントに全タスクを担わせるのではなく、専門化したサブエージェントに分割する手法だ。各サブエージェントの出力は1,000〜2,000トークン以内に凝縮し、管理役のオーケストレーターエージェントに返す。
これにより、オーケストレーターのコンテキストには各作業の「ハイライト」だけが蓄積される。詳細な実行ログが本体に流れ込むのを防げる。
4. コンテキスト刈り込み(Context Pruning)
次のステップに必要な情報だけを選び、不要な情報を積極的に除去する設計だ。Anthropicの推奨は「できるだけ小さく、できるだけ高品質な情報セット」を維持し続けること。
「何を追加するか」よりも「何を削るか」を考える時間の方が長くなる——これが、実際にコンテキスト設計に取り組んだ人間の共通した感想だ。
図2: 4つのコアテクニックと適用原則
Lat91での実体験:「情報は多いほど良い」という直感の崩壊
私たちが社内の10体AIエージェントチームを設計した初期、最初に犯したミスがあった。「AIには詳しい情報を渡すほど良い」という直感を信じすぎたことだ。
各エージェントに詳細な手順書、過去の実行ログ、参照ドキュメント一式をすべて渡した。しかし精度は期待したほど上がらなかった。むしろ、タスクが長くなるほどエージェントが迷走するケースが増えた。
原因を分析すると、コンテキストウィンドウの中に「今のタスクとは無関係な情報」が大量に混在していた。エージェントはそれを無視できず、関係のある情報を「探す」作業に注意力を消費していた。
改善策はシンプルだった。各エージェントには「今このステップだけで必要な情報」のみを渡す設計に変えた。過去の実行ログも、直接関係するものだけをフィルタリングして渡す。この変更後、体感として精度が安定した。
この経験で得た教訓がある。AIエージェントの設計では、何を追加するかを考える時間より、何を渡さないかを考える時間の方が実は長い。
よくある誤解と反論
「コンテキストウィンドウが大きくなれば解決するのでは?」
モデルのコンテキストウィンドウは確かに拡張され続けている。だが前述の通り、Chroma社の調査はすべてのモデルで「コンテキスト量が増えるほど性能が低下する」という結果を示した。ウィンドウが大きくなれば「詰め込める量」は増えるが、「詰め込むほど良い」というわけではない。コンテキストの量ではなく質の管理が重要という事実は変わらない。
「これはエンジニア向けの話では?経営者には関係ない?」
コンテキストエンジニアリングの技術的な実装はエンジニアが担う部分が多い。しかし「AIに何を見せるか」の判断には業務知識が必要だ。「この業務で重要な情報は何か」「どの過去データが次の判断に使えるか」——こうした判断を経営者や業務担当者が設計に反映することで、AIの精度は大幅に改善する。エンジニアだけの問題ではない。
中小企業が今週から始めるための3ステップ
Step 1: 「AIに渡している情報」を一度書き出す
システムプロンプト、添付ファイル、会話履歴——現在AIに渡しているすべての情報を可視化する。そのうち「今の質問に本当に必要なものはどれか」を問い直すだけで、多くの無駄が見つかる。
Step 2: コンテキスト設計書を作る
繰り返し使うプロンプトと添付情報を「セット」として文書化する。「この業務には、このシステムプロンプト+この参照データ」という組み合わせを明文化する。
Step 3: Before/Afterで精度を比較する
情報を絞った場合と詳細を渡した場合を比較し、どちらがアウトプットの質が高いかを記録する。この試行錯誤の積み重ねが、自社固有のコンテキスト設計の知見になる。
まとめ
- コンテキストエンジニアリングは、AIに渡す情報全体を設計する技術。プロンプト設計の上位概念にあたる
- コンテキストが増えるほど性能が下がる「コンテキストロット」が、AIエージェントの精度劣化の主因
- 圧縮・構造化メモ・サブエージェント分割・刈り込みの4テクニックが核心的な手法
- 「良い情報を追加する」より「不要な情報を削る」判断が、設計の大半を占める
- 中小企業でも「AIに何を見せているか」を意識するだけで、AIの精度は変わり始める
コンテキストエンジニアリングは、単なる技術トレンドではない。AIを実務に定着させるための設計思想の転換だ。プロンプトを磨く前に、一度「AIに何を見せているか」を問い直してほしい。
Lat91では、AIエージェントの設計・導入から運用まで、一気通貫でサポートしています。
「AIを使っているが思ったほど成果が出ない」「エージェントの精度が安定しない」というお悩みは、コンテキスト設計の見直しで改善できるケースが多いです。まずは無料相談でご相談ください。