ETL
ETL
ETLとは、Extract(抽出)、Transform(変換)、Load(格納)の略で、様々なシステムに散らばっているデータを集め、使いやすい形に加工して、DWHなどの分析基盤に入れる一連のデータ統合プロセス。
最終更新: 2026/1/28
各フェーズの詳細作業
- Extract (抽出):
- 接続先はAPI、DB、CSVなど様々です。「昨日更新された分だけ(差分抽出)」を取ってくるのが技術的に難しく、全件取ると重くなります。
- Transform (変換):
- クレンジング: 空白削除、半角全角統一。
- 名寄せ: 「A社」と「株式会社A」を統一コードにする。
- マスキング: 個人名やクレジットカード番号を伏せ字にする。
- 演算: 税抜き金額から税込金額を計算する。
- Load (格納):
- DWHのテーブル定義に合わせてデータを挿入します。
ETLからELTへの進化
従来は、DWHに入れる前に専用サーバーで加工(ETL)していました。しかし、最近のクラウドDWH(BigQueryなど)は超高性能になったため、「とりあえず生のままDWHに入れて(Extract -> Load)、DWHの中でSQLを使って高速に加工する(Transform)」という ELT 方式が主流になりつつあります。この「DWH内でのT」を担当するツールとして dbt が爆発的に普及しています。
由来・語源
(記述募集中)
使用例
(記述募集中)
関連用語
- 関連: