一、什么是数据治理?
定义:数据治理(Data Governance)是通过组织制度,流程,技术的结合与实践,以符合组织目标和法律要求的方式来管控数据的收集,存储,管理,使用等,也称数据管控。数据治理的目的是确保有效和高效地使用数据来支持决策制定,同时保护敏感信息并遵守法律法规要求。
通俗来说,数据治理就像管理超市里的水果,数据架构就是爸爸水果摆放得紧凑稳定,数据标准就是水果规格一致,元数据就是描述水果的产地和价格,数据质量就是保证没有烂水果,数据安全就是防止被人偷吃,数据生命周期就是计划摆放几天后下架。数据认责就是知道供货商和货物管理员是谁。
数据治理不是一个产品或者项目,而是一个持续的过程。
二、数据治理主要做什么?
数据治理的核心是优化现有数据查询或计算机体系,主要通过数据治理解决以下几点问题:
1.使用低价格的数据成本来提升数据查询效率。
2.规范数据指标建设,保障数据建模统一性。
3.优化数据管理方案,提升问题查找或解决问题效率。
数据治理不是一套技术方案,而是一套体系,通过长期迭代数据规范化管理,数据优化体系包括以下内容:
1.流程制度规范制定
2.数据架构制定
3.数据标准制定
4.组织,职能分工,智能
5.治理工具建设
6.治理沟通推进模式
三、数据治理的四个阶段分别是什么?
第一阶段:梳理企业信息,构建企业的数据资产库。首先要清楚企业的数据模型,数据关系对企业资产形成业务视图,技术试图等针对不同用户视角的展示。
第二阶段:建立管理流程,落地数据标准,提升数据质量。从企业角度梳理质量问题,抓紧标准落地。
第三阶段:直接为用户提供价值,本阶段依赖于前两个阶段的建设,为用户提供方便的获取数据的途径。
第四阶段:为企业提供数据价值。通过多种手段,对多种数据来源的数据进行分析,形成企业知识图谱,体现数据的深层价值。
通过这四个阶段的建设,建立起全企业的数据质量管理管控平台,以用户为中心,由用户使用数据,并通过用户的使用优化数据质量,既达到了数据治理的目标,也最大限度地发挥了数据的价值。