コンテキストウィンドウ

こんてきすとうぃんどう
自然言語処理

意味・定義

AIモデルが一度に処理できる入力と出力の最大トークン数。

解説

コンテキストウィンドウは、AIが一度に処理できる文章の長さの上限です。人間の短期記憶のようなもので、この範囲内の情報しか参照できません。 初期のGPT-3は2,048トークン(約1,500語)しか扱えませんでしたが、技術の進歩により大幅に拡大しました。GPT-4 Turboは128,000トークン、Claude 3は200,000トークン、Gemini 1.5 Proは驚異の100万トークンまで処理できます。 コンテキストウィンドウが大きいと、長い文書を一度に分析したり、長い会話履歴を保持したりできます。例えば、100ページの契約書を丸ごと読み込んで質問に答えたり、1日分のチャット履歴を覚えて文脈に沿った会話を続けたりできます。 ただし、コンテキストウィンドウが大きいほど処理コストも高くなります。また、「Lost in the Middle」問題といって、長い文章の中間部分の情報を見落としやすくなる傾向もあります。

使い方・例文

  • "法律事務所では、200ページの契約書をGemini 1.5 Proに読み込ませ、「この契約で当社が負うリスクは何ですか」と質問することで、全体を通した分析が可能です。 小説家は、執筆中の原稿全体をAIに渡し、「登場人物の性格に矛盾はないか」「伏線が回収されているか」といった一貫性のチェックを依頼できます。カスタマーサポートでは、長い会話履歴を保持することで、何度も同じことを説明させずに済む、スムーズな対応が実現します。"

関連語

トークンRAGメモリ管理

関連記事