Extension and Profiles
尽管其中许多元数据模式现在的发展,大部分已经适应了来自现实世界的实现情况带来的改变。这些改变可分为两类:扩展和配置文件。
所谓的扩展就是为了支持特殊类型或主题的描述或满足特殊兴趣组的需要而在已开发好的模式中增加新的元素。扩展增加元素的个数。
配置文件是模式的一个子集,是为了特殊兴趣组而实现的。配置文件可以约束将被利用的元素个数,改进元素定义描述资源的特殊类,更确切的说,指定一个元素可以取的值。
在实践中,很多的应用了基础元数据模式的扩展和配置。例如,国家生物信息基础结构
NBII
(
National Biological Information Infrastructure
)已经开发了一个基于
FGDC
内容标准的生物数据配置,来描述生物信息资源。配置文件定义了一个扩展了的数据集来描述生物数据,比如生物学分类的名称和它们在生物学层次上的类别。
美国教育网关部门已经在都柏林核心的基础上为鉴于资源工程(
GEMP
)建立了自己的元数据模式。
GEM
配置限制了都柏林核心中那些能够利用(比如
Contributor
是不允许的)而且造成某些强制性的元素。
Metadata in Action
一个县的土地计划者正在研究地区法律对特殊鸟类的影响。这个研究团队被撰写成一个生态学家、水文工作者、土木工程师和环境保护专家。
最近20年的远程遥感数据提供了一个鸟类生活环境湿地减少的趋势分析。这些数据集有FGDC的元数据。研究团队中的生物学家需要为一个领域清单引证结果。采用生物学的配置来扩展FGDC的元素集,他增加了基因的类别和分类等级。生态学家为收集方法和建模工具而感到忧虑。其中关系到人类数量变化的数据是采用Census Bureau元数据存档。
在技术报告中,这些研究结果被作者指定为都柏林核心元数据。当这个技术报告存到这个组织的知识库时,都柏林核心被作为自动产生MARC类别记录的基础。这个记录被编目程序自动的添加,并且包括在图书馆的在线公开访问目录中。
|
Creating Metadata
谁来创建元数据呢?这个规程的答案,资源被描述,工具是可用的,但是大多时候是共同努力的结果。
绝大多数基础的结构和管理的元数据由技术员工实现,他们初始化数据或创建数字对象,或产生于一个自动化的处理过程。对于描述的元数据,在很多情况如果由创始人提供信息是最好的。这种尤其适合于科学数据文档,创始人有效的理解了数据集的理性和可以增加的应用,对于这些人来说,只有少数,如果任何源于目录的原文的信息可以发挥作用。
然而,许多工程被发现应为有编目者或其他的信息专家创建描述的元数据而更加高效,因为作者或数据的创建者没有时间或技术。在其他情况下,采用研究人员和信息专家的组合。研究这可能创建一个骨架,完成立即可以供给的元素。最后的结构则由信息专家来增补或审查,为了和模式的语法和位置指南的一致性和复合性。
Creating Tools
许多元数据项目开始开发了工具,并且对于其他人也一样是可用的,有些时候还是免费的。日益增加的商业性的工具也已经可以获得了。创建工具可以分为:
●
模板(
Templates
)允许一个用户在一个预置的域中输入符合当前所使用的元素集的元数据
值。模板就会产生一个格式化的元素属性集和复合的值。
●
标识工具(
Mark-up tools
)将用指定模式的语言来构建元数据属性和数值。大多数工具产生
XML
或
SGML
文档类型定义
DTD
(
Document Type Definition
)。一些模板包含一个标识,
作为最后元数据转换的一部分。
●
析取工具(
Extraction Tools
)将从数字资源的分析中自动的创建元数据。这些工具通常仅限
于文本资源。被析取的元数据的质量会因为工具采用的算法和内容和文本的结构的而大不相
同。这些工具仅仅是创建元数据的一个辅助罢了。最后形成的元数据一般都经过人工的审
查和编辑。
●
转变工具(
Conversion Tools
)将元数据从一种格式转换为另一种格式。源中元素和目标格
式中的相似性将影响元数据的额外的编辑和人工输入需求的多寡。
元数据工具的开发,通常是为了支持特殊的元数据模式或元素集。针对特殊模式的网站最可
能提供相关工具集的连接。