データ品質
でーたひんしつ
データ品質とは、データが利用目的に対してどれだけ適切か(Fit for Purpose)を示す度合い。正確性、完全性、整合性、鮮度などの基準がある。
最終更新: 2026/1/28
品質の6つの次元 (DAMAホイール)
データ品質を評価するための国際的な基準です。
- 正確性 (Accuracy): 実態と合っているか。
- 完全性 (Completeness): 欠損値(Null)がないか。
- 一貫性 (Consistency): システム間で矛盾がないか。
- 一意性 (Uniqueness): 重複がないか。
- 適時性 (Timeliness): 最新の状態か。
- 有効性 (Validity): 定められたフォーマット通りか。
データプロファイリング
データ品質を改善するには、まず「現状どれくらい汚れているか」を知る必要があります。データをスキャンして統計情報(Nullの割合、最大値・最小値など)を出す作業をデータプロファイリングと呼びます。
由来・語源
(記述募集中)
使用例
(記述募集中)
関連用語
- 関連: