埋め込み
うめこみ自然言語処理
意味・定義
単語、文章、画像などを、意味を保持したまま数値ベクトルに変換する技術。エンベディングとも呼ばれる。
解説
埋め込みベクトル(Embedding)は、単語や文章を数値の配列に変換する技術です。AIが言葉の意味を理解し、比較するための基盤となります。 人間は「犬」と「猫」が似ていると直感的に分かりますが、コンピュータにとって文字列は単なる記号です。埋め込みベクトルは、単語の意味を数百次元の数値で表現することで、コンピュータが意味の類似性を計算できるようにします。 例えば、「王様」から「男性」を引いて「女性」を足すと「女王」に近いベクトルが得られる、という有名な例があります。これは、埋め込みベクトルが単語の意味関係を数学的に捉えている証拠です。 現代のAIシステムでは、埋め込みベクトルが至る所で使われています。検索エンジンは、クエリと文書の埋め込みベクトルを比較して関連性を判断します。レコメンドシステムは、ユーザーの好みと商品の埋め込みベクトルから、おすすめを提示します。
使い方・例文
"Google検索では、検索クエリと文書の埋め込みベクトルを比較し、キーワードが一致していなくても意味的に関連する結果を表示します。例えば「美味しいラーメン屋」と検索すると、「ラーメン」という単語がなくても、「麺料理」「人気店」といった関連する情報を含むページが上位に表示されます。 Spotifyのような音楽ストリーミングサービスでは、曲の特徴を埋め込みベクトルで表現し、ユーザーの好みに合った新しい曲をレコメンドしています。また、企業の社内文書検索では、質問と文書の埋め込みベクトルを比較することで、キーワードが一致していなくても意味的に関連する文書を見つけられます。"
関連語
Word2Vecベクトル検索意味検索