数据质量管理_第一篇 检查指标

一、数据质量检测系统

“工欲善其事,必先利其器”需对数据质量进行测量,就需要数据质量检测系统。

测量数据质量,监控关键数据

二、检测指标如下:

2.1有效性

  1. 字段长度有效:
  2. 字段内容有效
  3. 字段数值范围有效
  4. 枚举值个数有效
  5. 枚举值集合有效

2.2 唯一性

  1. 对主键是否存在重复数据的监控指标。

2.3 完整性

  1. 字段是否为空或NULL
  2. 记录数是否丢失
  3. 记录数环比波动
  4. 录数波动范围。
  5. 记录数方差检验

 2.4 准确性

  1. 数值同比
  2. 数值环比
  3. 数值方差检验
  4. 表逻辑检查

2.5 一致性

  1. 表级别一致性检查

2.6 时效性

  1. 表级别质量监控指标,数据是否按时产出

2.7数据剖析

  1. 最大值检查
  2. 最小值检查
  3. 平均值检查
  4. 汇总值检查

2.8 自定义规则检查

  1. 用户写自定义SQL实现的监控规则

从有效性、唯一性、完整性、准确性、一致性、时效性、数据剖析和自定义规则检查等几个维度对数据质量进行测量,但对于现在超级大的数据量级监控所有的数据是不符合成本效率的。因此,知道哪些数据为最关键的,对这些关键数据进行全链路的数据质量,这样有助于防止错误或揭示改进的机会。

三、数据质量问题的量化

对于数据质量的检测结果进行分析和量化,查找出现质量问题的数据链环节,定位数据问题,实行问责机制。

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值