什么是数据治理?
百度百科解释:
数据治理(Data Governance)是组织中涉及数据使用的一整套管理行为。由企业数据治理部门发起并推行,关于如何制定和实施针对整个企业内部数据的商业应用和技术管理的一系列政策和流程。
国际数据管理协会(DAMA)给出的定义:数据治理是对数据资产管理行使权力和控制的活动集合。
国际数据治理研究所(DGI)给出的定义:数据治理是一个通过一系列信息相关的过程来实现决策权和职责分工的系统,这些过程按照达成共识的模型来执行,该模型描述了谁(Who)能根据什么信息,在什么时间(When)和情况(Where)下,用什么方法(How),采取什么行动(What)。
数据治理的最终目标是提升数据的价值,数据治理非常必要,是企业实现数字战略的基础,它是一个管理体系,包括组织、制度、流程、工具。
个人理解:是企业内部由上而下,结合政策和技术对数据资产进行管理,目的是提升数据价值为企业服务。
数据治理的范围
数据治理项目的范围通常都会包含:组织建设、数据安全、数据开发、数据质量、元数据管理、数据价值等几个模块。
元数据管理
元数据从数据的角度可以分为三类:业务元数据、技术元数据和管理元数据。
- 业务元数据是从业务的视角去描述数据:表名称、表的血缘关系、表的字段说明、指标的统计口径等多种业务描述;
- 技术元数据从技术的角度去描述数据:表的sql、字段长度、字段类型、有效值、默认值等多种技术描述;
- 管理元数据是包含数据管理的信息在里面,例如:表的业务属主、表的技术负责人、表的读权限等
元数据的管理通常包含:血缘分析、数据生命周期。
数据质量
数据质量的提升通常包含以下几个方面:1)数据质量评估,2)数据质量检查,3)数据质量监控,4)问题处理机制,5)根据血缘关系和业务场景锁定高价值数据,进行高安全级别管控,避免数据出错。
数据价值
数据治理的目的就是提升数据价值,为企业带来实质性的效益。
组织建设
个人认为这是最为重要的,数据治理的大部分问题更多是政策、业务上的问题,保障数据治理能够长期有效的重要手段必须建立数据治理委员会,跨部门跨组织,把技术、业务等相关人员组织起来,制定政策、规范、评审需求、裁决分歧等。
参考资料:
https://baike.baidu.com/item/%E6%95%B0%E6%8D%AE%E6%B2%BB%E7%90%86/3819997?fr=aladdin