数据治理(Data Governance)是组织中涉及数据使用的一整套管理行为,是关于如何制定和实施,针对整个企业内部数据的商业应用和技术管理的一系列政策和流程的集合。
企业跨越数据治理的四道难关
1、数据孤岛
由于传统数据库架构缺乏弹性,当节点数超过一定规模后,再继续扩容往往反而会出现严重损害整个数据库系统性能的尴尬情况,使企业不得不设立多个集群来分别存储、分析数据。这种结构严重阻碍了整个企业中信息的共享和传播,甚至造成了不同业务板块之间的数据隔离。
无论是追踪数据沿袭、对数据进行分类,还是在系统中应用安全模型等,这一系列的数据治理行动在相互孤立又趋于混乱的数据系统中都是无法实现的。
2、数据质量差
数据质量差是数据治理过程中非常典型的问题之一。数据的可信度是数据驱动型企业的基石,这些企业需要来自众多不同渠道的海量数据,作为决策的参考和依据。
数据质量差可以分为两个层面:一是原始数据在从业务场景中获取时不够规范,出现的数据缺失、重复、损坏等。二是在进入数据库之后,需要数据库支持事务、高可用、强一致性等功能来保证数据的质量。
数据质量的好坏,一般表现在数据准确性、一致性、即时性、可用性和完整性五个方面。
3、数据不透明
你的企业有哪些数据?这些数据分别被存储在哪里?谁对什么样的数据拥有访问权限?这些个人或团队将通过特定种类的数据实现何种作业?回答好以上问题,才谈得上实现了数据的透明。
数据治理要求企业实现数据透明,而部分数