数据治理概念出现在数据仓库,大数据之后,这是一个进化,当数据作为一项资产,作为生产资料流通,必须要进行治理,数据跟其他有型物资不一样,具有如下特点:
- 虚拟性:数据看不见摸不着,没有事物形态,存在计算机内是0和1,存在纸张上是一些符号
- 衍生性:企业中的数据大多是伴随实物产生的,如设备数据,人力数据,产品数据
- 价值性:数据早期就是一个记录的功能,现在已经是可以直接产生经济价值了
数据治理是什么:通过一定的手段和标准,提高组织数据的可用性、安全性和质量
涵盖如下内容:
- 主数据管理:一个企业内,数据如果要无障碍,准确的流通起来,需要一个主数据管理系统,主数据是一组固定不变的数据,例如一个企业内的组织结构、产品信息,应该定义是唯一的
- 元数据管理:元数据是描述数据的数据,举例:100是数据,张三借了李四100块,描述这100快的元素:张三、借、李四、元,这些数元数据
- 数据质量:数据质量控制分事前、事中、事后三个阶段,保障质量,需要事前做标准规划、事中控制检测,事后回溯校验
- 数据安全:针对角色,组织划分不同的访问,写入,修改权限
- 数据生命周期:数据的产生,抽取,转换,存储,使用,丢弃过程