元数据的多角度透视

元数据是关于数据的数据,广泛存在于各领域,如数据仓库、软件构造、图书馆与信息界等。在数据仓库中,元数据用于描述数据和系统管理,而在软件构造中,它影响程序行为。元数据格式多样,包括CDWA、EAD、VRA核心类目、MARC和都柏林核心集(DC)等。DC简单易用,适合网络资源描述,而RDF作为元数据携带工具,促进了不同元数据体系间的互操作性。在数字化图书馆中,元数据体系设计需考虑标准性、完备性和可扩展性,上海图书馆和斯坦福大学图书馆提供了元数据应用实例。
摘要由CSDN通过智能技术生成

 元数据的多角度透视

一 、元数据的概念
    元数据最本质,最抽象的定义为:data about data (关于数据的数据)。它是一种广泛存在的现象,在许多顶域有其具体的定义和应用。
    在数据仓库顶域中,元数据被定义为:描述数据及其环境的数据。一般来说,它有两方面的用途。首先,元数据能提供基于用户的信息,如记录数据项的业务描述信息的元数据能帮助用户使用数据。其次,元数据能支持系统对数据的管理和维护,如关于数据项存储方法的元数据能支持系统以最有效的方式访问数据。具体来说,在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:(1)描述哪些数据在数据仓库中;(2)定义要进入数据仓库中的数据和从数据仓库中产生的数据;(3)记录根据业务事件发生而随之进行的数据抽取工作时间安排;(4)记录并检测系统数据一致性的要求和执行情况;(5)衡量数据质量。
在软件构造顶域,元数据被定义为:在程序中不是被加工的对象,而是通过其值的改变来改变程序的行为的数据。它在运行过程中起着以解释方式控制程序行为的作用。在程序的不同位置配置不同值的元数据,就可以得到与原来等价的程序行为。
在图书馆与信息界,元数据被定义为:提供关于信息资源或数据的一种结构化的数据,是对信息资源的结构化的描述。其作用为:描述信息资源或数据本身的特征和属性,规定数字化信息的组织,具有定位、发现、证明、评估,选择等功能。
此外,元数据在地理界,生命科学界等顶域也有其相应的定义和应用,在此不一一阐述。
二 、 主要元数据格式介绍
    由于元数据的广泛存在,导致元数据格式层出不穷,在此就图书馆和信息界的几种主要元数据格式进行介绍。
1.艺术作品描述类目(CDWA):
     是描述艺术作品的结构化工具,主要应用于艺术作品,珍善本和其它三维作品,它的描述重点在于“可动”的对象及其图像。它有27 个数据单元,每一单元还包括若干子单元,包括主题,记录,管理等项目。
2.编码文档描述(EAD):
    主要用于描述档案和手稿资源,并利用网络检索和获取档案手稿类信息资源。其高层元素主要有:头标,前面事项,档案描述。每一高层元素又包括多个小项以及若干细项。它能适应任何长度的目录和记录,并能描述在各种媒介上的所有类型的档案。EAD体系由三部分组成:数据模型,SGML文件类型定义和档案目录。
3.VRA核心类目(VRA core):
 最初是为在网络环境下对艺术,建筑等艺术类视觉资料的著录而起草,以后逐渐扩大应用到非艺术类顶域,目前VRA核心类目格式由两部分组成:
① 作品著录类目:用于任何一种作品实体或某种视觉文献所记载的原始作品(多为三维作品)的著录,包括作品类型,尺寸,主题等19个数据单元。
② 视觉文献著录类目:用于记载某种作品实体的视觉文献的著录,包括视觉文献类型,视觉文献格式等9个数据单元。
4.机读目录(MARC):
 它被广泛用于图书馆书目记录数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值