浅谈数据质量管理
笔者在长期的数据仓库、CRM等数据分析项目的开发工作中发现,低下的数据质量往往造成开发出来的系统与用户的预期大相径庭;很多数据仓库、CRM项目应用程度不高或最后失败,归根结底都是数据质量不高造成的。数据质量不高已经成为困扰此类项目的开发人员与用户的一个严重问题。为了提高大家对数据质量的认识,使企业领导重视数据质量的管理工作,笔者试图对数据质量及数据质量管理做一个较全面的介绍。
1. 何谓数据质量
何谓数据质量可从两个方面来理解:
l
数据的真实性。
数据必须真实准确的反映实际发生的业务。
l
数据的完备性。
数据的完备性是说数据是充分的,任何有关操作的数据都没有被遗漏。
l
数据的自洽性。
数据并不是孤立存在的,数据之间往往存在着各种各样的约束,这种约束描述了数据的关联关系。数据必须能够满足这种数据之间的关联关系