レイクハウス
れいくはうす
レイクハウス(Data Lakehouse)とは、データレイクの「柔軟性・低コスト」と、データウェアハウス(DWH)の「データ管理機能・高性能」を併せ持った新しいデータプラットフォーム。
最終更新: 2026/1/28
課題の解決
従来の「2層アーキテクチャ(レイク + DWH)」には以下の問題がありました。
- データの重複: 同じデータを2箇所に持つためコストがかかる。
- 鮮度の低下: レイクからDWHへのETL処理に時間がかかり、DWHのデータが古くなる。
実現技術
安価なクラウドストレージ(S3など)の上に、「Delta Lake」や「Apache Iceberg」といったオープンフォーマットのテーブル管理層を載せることで、データレイクでありながらACIDトランザクション(整合性)やスキーマ管理を実現しました。 これにより、データサイエンティスト(AI)もデータアナリスト(BI)も、同じデータを参照できるようになります。
由来・語源
(記述募集中)
使用例
(記述募集中)
関連用語
- 関連: