ベクターデータベース(ベクトルDB)
べくたーでーたべーす
意味
Vector Database(ベクトルデータベース)とは、テキスト、画像、音声などのデータを「ベクトル(数値の羅列)」に変換して保存し、データ同士の意味的な近さ(類似度)で検索できるデータベースのことである。 通常のデータベースがキーワードの一致で検索するのに対し、ベクトル検索では「意味」で検索...
概要
画像、音声、文章などのデータを、「ベクトル(数値の羅列)」に変換して保存・検索することに特化したデータベース。 AI(ChatGPTやLLM)のブームとともに注目されています。
仕組み
従来のDBは「キーワード(文字列)」で検索しますが、ベクトルDBは「意味の近さ(距離)」で検索します。 データをAIに通して「埋め込み表現(Embedding)」というベクトルに変換します。
- 「王様」−「男」+「女」=「女王」 というような計算ができるようになります。
用途
- RAG(検索拡張生成): ChatGPTに社内のマニュアルを読ませて回答させる際、関連するページをベクトル検索で探し出し、AIにヒントとして与える。
- 類似画像検索: 「この服に似ている服」を探す。