Pedia

ETL

ETL

ETLとは、Extract(抽出)、Transform(変換)、Load(格納)の略で、様々なシステムに散らばっているデータを集め、使いやすい形に加工して、DWHなどの分析基盤に入れる一連のデータ統合プロセス。

最終更新: 2026/1/28

各フェーズの詳細作業

  1. Extract (抽出):
    • 接続先はAPI、DB、CSVなど様々です。「昨日更新された分だけ(差分抽出)」を取ってくるのが技術的に難しく、全件取ると重くなります。
  2. Transform (変換):
    • クレンジング: 空白削除、半角全角統一。
    • 名寄せ: 「A社」と「株式会社A」を統一コードにする。
    • マスキング: 個人名やクレジットカード番号を伏せ字にする。
    • 演算: 税抜き金額から税込金額を計算する。
  3. Load (格納):
    • DWHのテーブル定義に合わせてデータを挿入します。

ETLからELTへの進化

従来は、DWHに入れる前に専用サーバーで加工(ETL)していました。しかし、最近のクラウドDWH(BigQueryなど)は超高性能になったため、「とりあえず生のままDWHに入れて(Extract -> Load)、DWHの中でSQLを使って高速に加工する(Transform)」という ELT 方式が主流になりつつあります。この「DWH内でのT」を担当するツールとして dbt が爆発的に普及しています。

由来・語源

(記述募集中)

使用例

(記述募集中)

関連用語

  • 関連:
TOP / 検索 Amazonで探す