数据字典 Data Dictionary
是一种用户可以访问的记录数据库和应用程序源数据的目录,用规范化的,无二义性的语言表达数据流程图的各组成部分,是对数据流程图各个组成部分的详细数据说明,也是表达新系统逻辑模型的主要工具之一。包括主动数据字典(active data dictionary)和被动数据字典(passive data dictionary),前者是指指在对数据库或应用程序结构进行时,其内容可以由DBMS自动更新的数据字典,后者是指修改时必须手工更新其内容的数据字典。 ——DMBOK 1.0
数据目录 Data Catalog
作为一种主动数据字典,用以帮助用户找到满足自身需求的数据来源并且帮助他们理解利用数据源进行挖掘的过程,同时也帮助企业在现有的数据源下实现更多的收益。多数关系型DBMS铲平将数据目录设置为关系型表格的形式。——Wikipedia
数据血缘 Data Lineage
通常是数据生命周期的一种,包括数据的起源以及到当前位置的完整路径描述,帮助用户分析信息的使用过程并且追溯在每一个节点上有特定用途的信息。——DMBOK 1.0
血缘分析 Linage Analysis
也即血统分析,是通过对数据处理过程的全面追踪,从而找到以某个数据对象为起点的所有相关数据对象以及这些元数据对象之间的关系。它是对数据对象内在关系的一种映射,同时,还结合了时间顺序、递次关系,也能够反映出一定的相关性和因果关系。——Wikipedia
影响分析 Influence Analysis
不同于血缘分析(血统分析)通过回溯的方式找到所有元数据对象以及这些元数据对象之间的关系,影响分析是基于某个数据对象,寻找依赖于该对象的处理过程或其它数据对象,并在某些数