ベクトルデータベース

べくとるでーたべーす
自然言語処理

意味・定義

高次元ベクトルを効率的に保存・検索するために最適化されたデータベース。

解説

ベクトルデータベースは、埋め込みベクトルを高速に保存・検索するための専用データベースです。従来のデータベースとは異なり、意味的な類似性で検索できます。 通常のデータベースは、完全一致や範囲検索が得意ですが、「似ている」という曖昧な検索は苦手です。ベクトルデータベースは、数百次元のベクトル空間で最も近い点を高速に見つける技術(近似最近傍探索)を使い、意味的に類似したデータを瞬時に取り出せます。 主要なベクトルデータベースには、Pinecone、Weaviate、Milvus、Qdrant、Chromaなどがあります。それぞれ特徴があり、Pineconeはクラウドネイティブで使いやすく、Milvusはオープンソースで大規模データに強い、といった違いがあります。 RAGシステムの構築には、ベクトルデータベースが不可欠です。大量の文書を埋め込みベクトルとして保存し、ユーザーの質問に関連する文書を高速に検索できるからです。

使い方・例文

  • "企業の社内文書検索システムでは、数万件の文書をベクトルデータベースに保存し、「プロジェクトの予算申請方法」といった自然言語の質問で、関連する規定やマニュアルを瞬時に見つけられます。 ECサイトでは、商品説明をベクトル化して保存し、「夏に着る涼しいシャツ」といった曖昧な検索でも、意味的に合致する商品を提案できます。また、画像検索では、画像の特徴をベクトル化し、似た画像を高速に検索するシステムが、Google画像検索やPinterestなどで使われています。"

関連語

埋め込みRAG意味検索

関連記事