Pedia

データ品質

でーたひんしつ

データ品質とは、データが利用目的に対してどれだけ適切か(Fit for Purpose)を示す度合い。正確性、完全性、整合性、鮮度などの基準がある。

最終更新: 2026/1/28

品質の6つの次元 (DAMAホイール)

データ品質を評価するための国際的な基準です。

  1. 正確性 (Accuracy): 実態と合っているか。
  2. 完全性 (Completeness): 欠損値(Null)がないか。
  3. 一貫性 (Consistency): システム間で矛盾がないか。
  4. 一意性 (Uniqueness): 重複がないか。
  5. 適時性 (Timeliness): 最新の状態か。
  6. 有効性 (Validity): 定められたフォーマット通りか。

データプロファイリング

データ品質を改善するには、まず「現状どれくらい汚れているか」を知る必要があります。データをスキャンして統計情報(Nullの割合、最大値・最小値など)を出す作業をデータプロファイリングと呼びます。

由来・語源

(記述募集中)

使用例

(記述募集中)

関連用語

  • 関連:
TOP / 検索 Amazonで探す