前言
在数仓建设过程中,数据质量的高低直接影响企业的决策、业务流程和客户满意度等多个方面。DAMA中数据质量的评估维度主要有:准确性、一致性、完整性、及时性。
- 准确性
准确性指数据是否存在异常或者错误的信息,如明细数据相对原始数据是否失真,汇总数据是否符合指标口径定义等。
- 一致性
对于数据仓库,一份数据在多个场景使用是很常见的,一致性即指对于同一个数据定义,可以是一个原始字段或一个加工后的指标,任意使用场景所使用的数据都是一样的。比如供应链和商品开发都关注缺货率指标,他们可能分属不同团队,对接不同的数据开发,但是用到的缺货率指标只能是同一份。
- 完整性
数据完整性包含两方面:记录完整性、字段信息完整性。即某张表数据记录是否缺失,某些非null字段是否为null。
- 及时性
及时性指业务需要看数时,要有数可看&#