非構造化データ
ひこうぞうかでーた
非構造化データとは、行や列の形式で定義できず、そのままではデータベースに格納したり集計したりできないデータ。
最終更新: 2026/1/28
生成AIによる革命
近年のディープラーニングと生成AI(LLM)の進化により、この非構造化データが「宝の山」に変わりました。
- 自然言語処理 (NLP): メールや日報を読んで「顧客満足度」や「パワハラ予兆」を分析する。
- 画像認識: 工場のカメラ映像から不良品を検知する。
- 音声認識: コールセンターの録音データから、問い合わせ内容を自動要約する。
保存と管理
RDBには入らない(BLOBとしては入るが重すぎる)ため、通常は オブジェクトストレージ(Amazon S3など)やデータレイクに保存します。最近では、これらをAIで「意味の座標(ベクトル)」に変換し、類似検索できるようにする ベクトルデータベース(Vector DB)の利用が急増しています。
由来・語源
(記述募集中)
使用例
(記述募集中)
関連用語
- 関連: