【数据治理相关概念】(一)名词概念

本文介绍了数据治理中的关键概念,包括数据字典、数据目录、数据血缘、血缘分析、影响分析、非结构化数据、数据仓库、数据集市、数据地图和数据湖。数据字典提供数据库和应用程序源数据的目录;数据目录帮助用户查找和理解数据来源;数据血缘追踪数据路径;血缘分析关注数据处理过程;影响分析则分析数据变化的影响范围;非结构化数据描述了不定格式的数据类型;数据仓库是支持决策的数据集合;数据集市是针对特定主题的部门级数据仓库;数据地图用于数据融合;数据湖存储各种格式的企业所有数据。
摘要由CSDN通过智能技术生成

数据字典 Data Dictionary

是一种用户可以访问的记录数据库和应用程序源数据的目录,用规范化的,无二义性的语言表达数据流程图的各组成部分,是对数据流程图各个组成部分的详细数据说明,也是表达新系统逻辑模型的主要工具之一。包括主动数据字典(active data dictionary)和被动数据字典(passive data dictionary),前者是指指在对数据库或应用程序结构进行时,其内容可以由DBMS自动更新的数据字典,后者是指修改时必须手工更新其内容的数据字典。 ——DMBOK 1.0

数据目录 Data Catalog

作为一种主动数据字典,用以帮助用户找到满足自身需求的数据来源并且帮助他们理解利用数据源进行挖掘的过程,同时也帮助企业在现有的数据源下实现更多的收益。多数关系型DBMS铲平将数据目录设置为关系型表格的形式。——Wikipedia

数据血缘 Data Lineage

通常是数据生命周期的一种,包括数据的起源以及到当前位置的完整路径描述,帮助用户分析信息的使用过程并且追溯在每一个节点上有特定用途的信息。——DMBOK 1.0

血缘分析 Linage Analysis

也即血统分析,是通过对数据处理过程的全面追踪,从而找到以某个数据对象为起点的所有相关数据对象以及这些元数据对象之间的关系。它是对数据对象内在关系的一种映射,同时,还结合了时间顺序、递次关系,也能够反映出一定的相关性和因果关系。——Wikipedia

影响分析 Influence Analysis

不同于血缘分析(血统分析)通过回溯的方式找到所有元数据对象以及这些元数据对象之间的关系,影响分析是基于某个数据对象,寻找依赖于该对象的处理过程或其它数据对象,并在某些数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值