ゼロショット学習
ぜろしょっとがくしゅう意味・定義
学習時に見たことがないクラスやタスクに対しても、事前知識を活用して予測を行う機械学習の手法。
解説
Zero-Shot学習は、学習データに含まれていないクラスを認識する技術です。人間が「シマウマは馬のような動物で、白黒の縞模様がある」という説明だけで、シマウマを認識できるのと同じ発想です。 Zero-Shot学習の鍵は、クラスの意味的な表現です。各クラスを、属性や説明文で表現します。例えば、「シマウマ」を「4本足、草食、縞模様、馬に似ている」という属性で表現します。モデルは、画像の特徴とクラスの意味的表現を対応付けることを学習します。 大規模言語モデルでは、Zero-Shot学習が標準的な機能です。GPT-3やGPT-4は、学習データに含まれていないタスクでも、指示だけで実行できます。例えば、「次の文章を古文に翻訳してください」という指示で、古文翻訳ができます。 Zero-Shot学習は、新しいクラスが頻繁に追加される分野で有用です。また、データ収集が困難な希少なクラスの認識にも使われます。
使い方・例文
"画像認識では、「トラ」「ライオン」「ヒョウ」で学習したモデルが、「チーター」を見たことがなくても、「チーターは黄色で黒い斑点があり、ネコ科で速く走る」という説明から、チーターを認識できます。 自然言語処理では、GPT-3に「次の文章を関西弁に翻訳してください」と指示するだけで、関西弁翻訳ができます。学習データに関西弁翻訳の例がなくても、言語の一般的な知識から実行できます。また、商品レビューの感情分析でも、新しいカテゴリの商品に対して、Zero-Shotで分析できます。"
関連語
関連記事
大規模言語モデル
だいきぼげんごもでる
膨大なテキストデータで学習された、数十億から数兆のパラメータを持つニューラルネットワークモデル。LLM(Large Language Model)とも呼ばれる。
自然言語処理機械学習
きかいがくしゅう
データからパターンを学習し、予測や判断を行うAI技術の一分野。明示的にプログラムされることなく、経験から学習する。
機械学習ディープラーニング
でぃーぷらーにんぐ
多層のニューラルネットワークを用いた機械学習の手法。深層学習とも呼ばれる。
機械学習ニューラルネットワーク
にゅーらるねっとわーく
人間の脳の神経細胞(ニューロン)の構造を模倣した計算モデル。複数の層で構成され、データから特徴を学習する。
機械学習