数据治理笔记001

第一章 全面认识数据治理

数据不仅可以记录历史,还能预测未来

1.1 什么是数据治理

企业通过数据治理来挖掘数据背后的巨大商业价值
数据治理的三大要害:
第一,要定义数据,让抽象的数据变成可读、可理解的信息;
第二,要有一个完整的数据地图或数据资源目录,盘活企业的数据
资产,方便用户随时找到想要的数据;
第三,要做好数据质量管理,提升数据质量并提升数据的使用率。

DAMA对数据治理的定义:数据治理是对数据资产管理行使权利和控制的活动集合
DGI的定义:数据治理是一个通过一系列与信息相关的过程来实现决策权和职责分工的系统,这些过程按照达成共识的模型来执行,该模型描述了谁(Who)能根据什么信息,在什么时间(When)和情况(Where)下,用什么方法(How),采取什么行动(What)。

所有为提高数据质量而展开的技术、业务和管理活动都属于数据治理范畴。数据治理的最终目标是提升数据利用率和数据价值,通过有效的数据资源管控手段,实现数据的看得见、找得到、管得住、用得好,提升数据质量和数据价值

1.2 数据治理相关术语和名词
1.数据元
用一组属性描述定义、标识、表示和允许值的数据单元
数据元由三部分组成,对象,特性和表示。例如:手机号、性别
2.元数据
元数据是描述数据的数据,或是关于数据的结构化数据
3.主数据
主数据是企业内部需要在多个部门和多个信息系统间共享的数据。
主数据是企业开展业务的基础,只有得到正确的维护,才能保证业务系统的参照完整性。
主数据三大特性:高价值性,高共享性,相对稳定性
主数据4个超越:超越业务,超越部门,超越系统,超越技术
4. 业务数据
业务数据是业务活动过程中或系统自动产生的既定事实的数据。
业务数据来自三个方面:
第一、业务交易过程中产生的数据。例如,业务单,交易单,这些都是手动生成的数据。
第二、系统产生的数据;包括硬件运行状况,软件运行状况,资源消耗状况,应用使用状况,接口调用状况,服务健康状况
第三、自动化设备产生的数据;例如物联网设备的运行数据,生产采集数据
业务数据的特点:时效性强,数据量大
业务数据主要作用:业务数据主要面向应用,为业务应用提供服务。
5.主题数据
6.数据仓库
数据仓库 Data Warehouse ,数据仓库是面向主题的,集成的,相对稳定的,反应历史变化的数据集合,用于支持管理决策。
利用这些宝贵的数据做出最明智的商业决策
7.数据湖
将数据湖理解为一个融合了大数据集成、存储、处理、机器学习、数据挖掘的解决方案。

1.3 数据治理什么
数据资产:不是所有数据都是数据资产
数据资产的四个核心条件:
①数据资产是企业的交易或者事项形成的
②由企业拥有或者控制
③预期会给企业带来经济利益
④成本或价值可衡量
数据资产的利益相关方:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值