データレイクハウス
でーたれいくはうす
Data Lakehouse
類語・同義語: レイクハウス、次世代DWH
データレイクハウスとは、「データレイク」の柔軟性(低コストで何でも保存)と、「データウェアハウス」の管理機能(高品質で高速な分析)をいいとこ取りした、新しいデータ基盤アーキテクチャ。Databricksなどが提唱し、AIやBI分析の両方に対応できる。
最終更新: 2026/1/16
概要
データレイクハウス(Data Lakehouse)は、企業のデータ基盤の歴史における「統合」の最終形である。
これまでの課題
- DWH(倉庫): 綺麗に整理されたデータしか入らない。AI用の画像データなどは扱えない。
- Data Lake(湖): 何でも投げ込めるが、ゴミ捨て場になりやすく、SQLでの高速分析ができない。
これまでは、「湖から倉庫へデータを移す(ETL)」というバケツリレーが必要だったが、これは壊れやすくコストも高い。
レイクハウスの解決策
「湖(安価なクラウドストレージ)」の上に、「倉庫のような管理機能(メタデータ層)」を被せることで、データを移動させずに、直接SQLで分析したり、AIに学習させたりすることを可能にした。
由来・語源
Data Lake(湖)+ Data Warehouse(倉庫)= Lakehouse(湖畔の家)。Databricks社などが提唱。
使用例
「Snowflakeでデータレイクハウスを構築する」「ETL処理を簡素化するためにレイクハウスへ移行する」
関連用語
- 同義語: レイクハウス, 次世代DWH
- 関連: データレイク, データウェアハウス, ETL, AI, BI, クラウドストレージ, クラウド, SQL