Metadata Schemes and Element Sets
许多元数据模式正在各种不同的用户环境和规程中被开发出来。这一节中我们将讨论其中最通用的几个模式。
Dublin Core
都柏林核心元数据元素集是从
1995
年受
OCLC
和国家超级计算应用中心资助的研讨会讨论发家的。由于这个研讨会在都柏林成立,哦,元素集合被命名为都柏林核心。都柏林核心后续的开发和相关的规约由都柏林核心元数据机构
DCMI
(
Dublin Core Metadata Initiative
)管理。
都柏林核心的初衷是定义一个可以被作者用来描述自己的
Web
资源的元素集。面临一个电子资源的增殖和图书馆专业所有资源的无能为力的问题,其目标是定义可适用于非编目的一些元素和简单的规则。元素由原来的
13
个,增加到后来的
15
个:标题、创建者、主体、描述、贡献者、时间、类型、出版社、标识、资源、语言、关系、覆盖范围和权力(
Title
, Creator, Subject, Description, Publisher, Contributor, Date, Type, Format, Identifier, Source, Language, Relation, Coverage, And Rights
)。
都柏林核心很简单很明了,用来描述基于
Web
的文档。然而,都柏林核心也被应用到其它不同的类型的资源和需求有一些复杂的应用中。在历史上,在极简抽象派艺术家的观点的支持者,那些强调保持元素最小化,语义和语法简单需求的人,和结构化学家观点的支持者,那些争论精细语义区别和特殊社区
/
组的更多可扩展性的人,之间曾经有过紧张局面。
这些讨论导致了都柏林核心的限定和非限定(简单)之间的区别。限定词可以用来改进(缩小范围)一个元素或标识用来表示一个元素值的编码模式。例如,元素日期(
Date
)可以用到改进过程中来狭义化元素的日期语义——对象被创建的日期。日期也可以应用到编码模式的非限定中,用来标识格式在那一天被创建,例如,参照
ISO8601
标准表示日期和时间。
所有的都柏林核心元素是可选的而且可以重复。可以采用不同的顺序来表示。都柏林描述推荐在合适的地方(数据域)使用限定的值
,
(例如,主题域中的限定词汇),这不是强行要求的。然而,工作组决定为固定的元素,比如,资源类型,讨论授权列表。当都柏林把内容规则留给特殊的实现时,
DCMI
则鼓励为特定的领域,比如,教育和政府,采用应用规范(领域特殊规则)。图书馆工作组开发了一个图书馆应用配置。
Dublin
Core Example
|
Title=
”Metadata Demystified”
Creator=
”Brand, Amy”
Creator=
”Daly, Frank”
Creator=
”Meyers, Barbara”
Subject=
”metadata”
Description=
”Presents an overview ofmetadata conventions inpublishing.”
Publisher=
”NISO Press”
Publisher=
”The Sheridan Press”
Date=
”2003-07"
Type=
”Text”
Format=
”application/pdf”
Identifier=
”http://www.niso.org/standards/resources/Metadata_Demystified.pdf”
Language=
”en”
|
这是
Dublin Core
的一个实例
由于很简单,所以现在都柏林核心的元素已经被外面的图书馆社区、研究者、博物馆管理人员和音乐收藏者所采用。全球已经有数百个项目采用都柏林核心来编目或从互联网收集数据。其中超过
50%
有
DCMI
网站的联检。主题包括从文化遗产和艺术到数学、物理等领域。同时,都柏林核心从都柏林核心元数据元素的简单的维护扩展到一个自称是“献身于提倡采用交互式的元数据标准,为发现系统开发特定的元数据词汇”的组织。
The Text Encoding Initiative (TEI)
TEI
是一个国际化的项目,为标记电子文本,比如,小说、剧本和诗歌开发用户指南,主要支持对人类学的研究。并且制定如何编码作品的文本,《
TEI
电子文本编码和交互》(
TEI Guidelines for Electronic Text Encoding and Interchange
)也指定了嵌入到资源当中的一个文件标题部分,其中包含关于作品的元数据。
TEI
标题和
TEI
的其余部分一样,被定义为
SGML DTD
(
Document Type Definition
)——定义成
SGML
语法,用来描述文本结构和元素的一个标签和规则的集合。这样的
SGML
成为电子资源的本身的一部分。由于
TEI DTD
很大而且很复杂,所以很难适用于大规模的文本应用,所以一个称作
TEI Lite
的简单的
DTD
子集,通常被应用到图书馆。
假设通过
TEI
编码的文本是印刷品的电子版。同时,
TEI
标题部分可以用来记录电子或非电子资源版本引用的书目。基本的书目信息和图书目录相似,所以可以和
MARC
自由的映射。但是,也有些专门为详细记录文本是如何被改编和编辑,如何构成,修订了什么,以及哪些非书目事实的元素。一些图书馆用
TEI
标题为自己的目录导出
MARC
记录,而另一些图书馆则把
MARC
当作为资源文本创建
TEI
标题的基础。