什么是元数据
元数据最常见的定义是“关于数据的数据”。这个定义很简单,但不好理解,什么叫数据的数据呢?元数据的信息范围很广,不仅包括技术和业务流程、数据规则和约束,还包括逻辑数据结构和物理数据结构等。它描述了数据本身(如数据库、数据元素、数据模型),数据表示的概念(如业务流程、应用系统、软件代码、技术基础设施),数据与概念之间的联系(关系)。
举个例子,元数据就像一个大型图书馆中的目录,目录不仅提供了必要的信息(图书馆拥有哪些书籍和资料以及它们被存储在什么地方),还帮助读者可以使用不同的方式(主题领域、作者或者书名)来查找资料。
通俗来讲,只要能够用来描述某个数据的,都可以认为是元数据。
元数据的分类
元数据通常分为三种类型:业务元数据、技术元数据和操作元数据。这些类别使人们能够理解属于元数据总体框架下的信息范围,以及元数据的生产过程。
a.业务元数据:业务元数据是用户访问数据时了解业务含义的途径。业务元数据包括主题域、概念、实体、属性的非技术名词和定义、属性的数据类型和其他特征,如范围描述、计算公式、算法和业务法则、有效的阈值及其定义。
b.技术元数据:实施人员开发系统时使用的数据。它提供有关数据的技术细节、存储数据的系统以及在系统内和系统之间数据流传过程的信息。包括物理数据库、表、字段、表关系等。
c.操作元数据:数据处理日志及数据运营类数据,描述了处理和访问数据的细节,包含调度频次、访问日志等。
在信息技术之外的领域,如在图书馆或者信息科学中,元数据被描述为不同的类别:
a.描述元数据:描述资源并支持识别和检索,如标题、作者和主题等。
b.结构元数据:描述资源及其组成组件之间的关系,如页数、章节等。
c.管理元数据:用户描述管理生命周期的元数据,如版本号、存档日期等。