整理不易,转发请注明出处,请勿直接剽窃!
点赞、关注、不迷路!
摘要:元数据的定义、3种类型、6大作用、元数据管理、应用
元数据定义
元数据就是描述数据的数据。
元数据是比一般意义上的数据范畴更加广泛的数据,不仅表示数据的类型、名称、值等信息,还提供数据的上下文描述,比如数据的所属业务域、取值范围、数据间的关系、业务规则、数据来源等。
元数据以数字化方式描述企业的数据、流程和应用程序,为企业数字资产的内容提供了上下文,使得数据更容易理解、查找、管理和使用。
举个例子:图书馆中的元数据
图书馆都会用一个叫作“图书目录”的文件夹来管理藏书,图书目录包含图书名称、编号、作者、主题、简介、摆放位置等信息,用来帮助图书管理员管理和快速查找图书。元数据就如同图书馆的图书目录一样,能够帮助数据管理员管理数据。
元数据的3种类型
业务元数据、技术元数据和操作元数据。
业务元数据
描述数据的业务含义、业务规则等。
举例
业务定义、业务术语解释等;
业务指标名称、计算口径、衍生指标等;
业务引擎的规则、数据质量检测规则、数据挖掘算法等;
数据的安全或敏感级别等。
技术元数据
结构化处理后的数据。
举例
物理数据库表名称、列名称、字段长度、字段类型、约束信息、数据依赖关系等;
数据存储类型、位置、数据存储文件格式或数据压缩类型等;
字段级血缘关系、SQL脚本信息、ETL信息、接口程序等;
调度依赖关系、进度和数据更新频率等。
操作元数据
描述数据的操作属性,包括管理部门、管理责任人等。
举例
数据所有者、使用者等;
数据的访问方式、访问时间、访问限制等;
数据访问权限、组和角色等;
数据处理作业的结果、系统执行日志等;
数据备份、归档人、归档时间等。
元数据的6个作用
- 描述:对数据对象的内容、属性的描述。 定位:有关数据资源位置方面的信息描述,如数据存储位置、URL等记录。
- 检索:在描述数据的过程中,将信息对象中的重要信息抽出标引并加以组织,建立它们之间的关系,为用户提供多层次、多途径的检索体系。
- 管理:对数据对象的版本、管理和使用权限的描述。
- 评估:由于有元数据描述,用户在不浏览具体数据对象的情况下也能对数据对象有个直观的认识,方便用户的使用。
- 交互:元数据对数据结构、数据关系的描述方便了数据对象在不同部门、不同系统之间进行流通和流转,并确保流转过程中数据标准的一致性。
元数据管理
元数据管理是对涉及的业务元数据、技术元数据、操作元数据进行盘点、集成和管理。
采用科学有效的机制对元数据进行管理,并面向开发人员、业务用户提供元数据服务,可以满足用户的业务需求,为企业业务系统和数据分析的开发、维护等过程提供支持。
目标
- 建立指标解释体系
- 提高数据溯源能力
- 数据质量稽核体系
企业实施元数据管理的主要业务诉求
- 建立企业数据资产目录
- 消除冗余,加强数据复用
- 降低因人员流动而导致知识流失的风险
- 提供数据血缘探查能力,提高数据分析的质量
内容
- 元模型管理
- 元数据审核
- 元数据维护
- 元数据版本管理
- 元数据变更管理
元数据应用
- 数据资产地图
- 元数据血缘分析
- 元数据影响分析
- 元数据冷热度分析
- 元数据关联度分析