Pedia

データレイクハウス

でーたれいくはうす

Data Lakehouse

類語・同義語: レイクハウス、次世代DWH

データレイクハウスとは、「データレイク」の柔軟性(低コストで何でも保存)と、「データウェアハウス」の管理機能(高品質で高速な分析)をいいとこ取りした、新しいデータ基盤アーキテクチャ。Databricksなどが提唱し、AIやBI分析の両方に対応できる。

最終更新: 2026/1/16

概要

データレイクハウス(Data Lakehouse)は、企業のデータ基盤の歴史における「統合」の最終形である。

これまでの課題

  1. DWH(倉庫): 綺麗に整理されたデータしか入らない。AI用の画像データなどは扱えない。
  2. Data Lake(湖): 何でも投げ込めるが、ゴミ捨て場になりやすく、SQLでの高速分析ができない。

これまでは、「湖から倉庫へデータを移す(ETL)」というバケツリレーが必要だったが、これは壊れやすくコストも高い。

レイクハウスの解決策

「湖(安価なクラウドストレージ)」の上に、「倉庫のような管理機能(メタデータ層)」を被せることで、データを移動させずに、直接SQLで分析したり、AIに学習させたりすることを可能にした。

由来・語源

Data Lake(湖)+ Data Warehouse(倉庫)= Lakehouse(湖畔の家)。Databricks社などが提唱。

使用例

「Snowflakeでデータレイクハウスを構築する」「ETL処理を簡素化するためにレイクハウスへ移行する」

関連用語

  • 同義語: レイクハウス, 次世代DWH
  • 関連: データレイク, データウェアハウス, ETL, AI, BI, クラウドストレージ, クラウド, SQL
TOP / 検索 Amazonで探す