数据完整性是在数据生命周期中(从记录数据到销毁数据)整个过程中数据准确性和一致性的保证。简单来说,数据完整性意味着您已经按预期记录了数据,并且在整个生命周期中都没有意外出现。这个概念很简单,但实践却并非如此,数据完整性是任何大数据系统的重要关节之一。
数据完整性的重要性
数据完整性非常重要,因为几乎每个关键业务决策都基于公司的数据。凭借良好的数据完整性,您可以分析公司的数据来回答以下问题:您的业务成长怎么样?您的业务成本是多少?您在不同地区的销售情况如何?您的业务中有哪些是入不敷出的?企业不同部门的效率是多少?您的企业是否达到基准目标?很显然,面对这些综合性问题如果没有完整的数据我们很难回答。
数据完整性面临的挑战
数据完整性面临的挑战分为两大类:
物理容灾
存放数据的物理系统可能会遭受任何物理破坏:火灾,洪水,爆炸,极端温度,辐射,腐蚀以及任何可能影响物理结构的自然灾害都可能影响您的物理数据完整性。
人为操作错误
软件由人写,被人用,人比机器更容易出错,所以当人力介入到数据系统时,就可能破坏数据的逻辑完整性。除了人为操作不当外还有以下几种可能