华为数据之道-读书笔记7

本文介绍了华为基于PDCA的数据质量管理框架,包括数据质量的六个维度:完整性、及时性、准确性、一致性、唯一性和有效性。强调了数据质量管理范围、全面监控异常数据的重要性,以及通过数据质量度量牵引质量提升的方法。通过设计和执行质量度量,推动数据owner改进数据质量,实现数据的清洁。
摘要由CSDN通过智能技术生成

打造“清洁数据”的质量综合管理能力

一、基于PDCA的数据质量管理框架

1、什么是数据质量

       华为数据质量指“数据满足应用的可信程度”,有以下6个维度

  • 完整性:数据在创建、传递过程中无缺失和遗漏,包括实体完整、属性完整、记录完整和字段值完整四个方面。
  • 及时性:及时记录和传递相关数据,满足业务对信息获取的时间要求。数据交付要及时,抽取要及时,展现要及时;数据交付时间过长可能导致分析结论失去参考意义。
  • 准确性:真实、准确地记录原始数据,无虚假数据及信息。数据要准确反映其所建模的“真实世界”实体。
  • 一致性:遵循统一的数据标准记录和传递数据和信息,主要体现在数据记录是否规范、数据是否符合逻辑。
  • 唯一性:同一数据只能有唯一的标识符。体现在一个数据集中,一个实体只出现一次,并且每个唯一实体有一个键值且该键值只指向该实体。
  • 有效性:数据的值、格式和展现形式符合数据定义和业务定义的要求。

2、数据质量管理范围

       流程质量是基于流程结果评估业务执行的好坏,数据质量更关注业务对象、业务规则、业务过程、业务结果等数据是否得到了及时记录。

3、数据质量的总体框架

       数据质量管理以数据清洁为目标,以业务需求为驱动,通过PDCA循环,提升数据质量,达到数据质量结果满意。

  • 自上而下打造数据质量领导力
  • 全面推进数据质量持续改进机制
  • 不断加强数据质量能力保障

二、全面监控企业业务异常数据

       只要涉及人为干预,总会存在数据质量问题。问题的发现既可以“正向”主动监控,也可以“逆向”通过

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值