关于元数据的54个问题
1. 什么是元数据(metadata)? | |
|
22. DC 元数据所描述的对象是什么? DC 元数据所描述的对象是"资源(Resource)",资源是任何可以标识的东西。可以是实体的,也可以是抽象的。常见的例子有电子文档,图像,服务(例如,"洛杉矶今天的天气预报"),还有其他资源的集合。并非所有的资源都是网上可检索的;例如,人,机构,还有图书馆里装订成册的书都可以被认为是资源。 曾经定义为DLO(Document Like Object),由于无法确切定义而放弃。 曾经表述为"数字对象(Digital Object)",由于将物理资源对象排除在外而缺乏普遍意义。 目前的表述作为语义万维网的概念之一,获得支持和承认。 23. DC 元数据的历史沿革情况如何? 1995 年3 月,由OCLC 与国家超级计算应用中心(NCSA)联合发起,52 位来自图书馆界、电脑网络界专家共同研究产生。目的是希望建立一套描述网络电子文献的方法,以便网上信息检索。其中心议题是如何用一个简单的元数据记录来描述种类繁多的电子资源,使非图书馆专业人员都能够了解和使用著录格式,来描述网上资源。因第一届会议在美国OHIO 州的Dublin 召开,提出一个元数据核心集,因此得名。 24. DCMI 是一个怎样的机构? DCMI 是致力于DC 推广应用和标准化的组织,由自愿加入的个人组成,来自世界各地,具有不同的专业背景。但现在还只是一个虚拟的实体,挂靠(Host)OCLC,不具有任何法律地位。 25. DCMI 目前有哪些推荐"标准"? 属于DCMI 推荐的元数据方案目前主要有三个:DCMES/DCTerms/DCTYPE。另外还有一些置标方案和编码体系属于DCMI 的推荐标准。 参见;http://dublincore.org/documents/ 26. DCMI 如何维护DC 元数据? DCMI 通过一套运行机制管理维护DC 元数据及其应用。每年的年会是其进行总结、回顾和展望的重要事件,邮件列表是其提出动议、讨论问题和日常运行的主要方式。其运行机制每年都会有一些变化,一些老的做法经过修正,一些新的做法加进来。 DCMI 的基本组成单位是工作组(WG: Working Group),每个工作组在成立时有相应的章程(Charter)规定了工作组的职能和任务,每个工作组有1 至2 名主席,负责组织议题,年会时工作组需要总结前一年度的工作进展,提出新一年的计划。平时通过邮件列表进行讨论。 元数据规范词、文档等经过适当流程后需经过应用委员会(Usage Board)批准才能最终发布。 详见以下文档: ? Guidelines for Dublin Core Working Groups ? Procedure for approval of DCMI Metadata Terms and Recommendations ? DCMI Usage Board (UB) Administrative Processes 27. DCMES(都柏林核心元数据集)包括哪15 个元素? 内容属性 题名Title 主题Subject 描述Description 来源Source 语种Language 关联Relation 覆盖范围Coverage 知识产权属性 创建者Creator 出版者Publisher 其他责任者Contributor 权限Rights 形式属性 日期Date 类型Type 格式Format 标识符Identifier 相关文档请参考:http://dc.library.sh.cn/ 28. 什么是限定版(Qualified)DC?包括多少元素? 目前DCQ 已经被全部归到了DCTerms 命名域下,共有33 个限定词(refinements)和17 个编码体系修饰词( encoding scheme qualifier ) 。详见: http://dublincore.org/documents/dcmi-terms/ 。 ( 中文翻译参见:http://www.dc.library.sh.cn/DC/dcmi-terms.htm) 29. 什么是限定?什么是编码体系修饰词? 限定词refinements 也叫修饰词,是对元数据元素语义的进一步限定和细化,通常通过vocabulary 和encoding scheme 两种方式,后者称为编码体系修饰词。 30. 什么是DC 的类型词表?DC 目前认可哪些类型? | |
|
4楼 DC 对于资源类型建立了一个规范词表, 称为DC 的类型词表。见:http://dublincore.org/documents/dcmi-type-vocabulary/ 目前包括:资源集合Collection, 数据集Dataset, 事件Event, 图像Image, 交互资源InterativeResource, 服务Service, 软件Software, 声音Sound, 文本Text, 物理对象PhysicalObject 共十种,其中图像还有静态图像(StillImage)和动态图像(MovingImage)两个下位类型。类型词的中文翻译见:http://www.dc.library.sh.cn/DC/dcmi-type-vocabulary.htm 31. 什么是DC 的"资源集合元数据应用纲要"?有哪些内容? DC 资源集合元数据应用纲要指以资源集合为描述对象的元数据应用纲要,规定了对资源集合进行描述所需采用的元素。目前的状态是工作草案报批稿。参见: http://www.ukoln.ac.uk/metadata/dcmi/collection-application-profile/ 。中文翻译参见: http://www.dc.library.sh.cn/DC/collectionMeta.htm 32. 什么是DC 图书馆元数据应用纲要? DC 图书馆元数据应用纲要指以图书馆应用为适用领域的元数据应用纲要,规定了对图书馆资源进行描述所需采用的元素。目前的状态是工作草案。参见:http://dublincore.org/documents/library-application-profile/ 。中文翻译参见: http://www.dc.library.sh.cn/DC/dc_lib.htm 33. 什么是DC 教育元数据应用纲要? DC 教育元数据应用纲要指以教育应用为适用领域的元数据应用纲要,规定了对教育资源进行描述所需采用的元素。目前的状态是工作草案。参见: http://dublincore.org/documents/education-namespace/ 。 34. 什么是DC本地化?客户化?如何进行DC的本地化和客户化? 国际化是DCMI 制定和推广元数据标准和应用的一项基本原则。国际化就是要适应各语种、文化的需要,对其元数据方案进行本地化和客户化。本地化是指使一个通用的元数据方案能够适用本地语言、规范词表和其它规范的过程,例如元素名称的翻译和显示、本地分类体系的采用等等;客户化指为适应特定应用领域而进行的限定、扩展等,当然这种限定和扩展要在DC 元数据抽象模型的框架之下进行。本地化和客户化都需要制定相应的规则或进行进一步的规范或约束。 35. 什么是DC 元数据抽象模型? DCMI 元数据所描述的"资源(resource)"的抽象模型如下: • 每个资源(resource)具有零个或多个属性(properties); • 每个属性(property)具有一个或多个值(values); • 每个值(value) 本身是一个资源(resource)(即:用来描述资源,与属性相关的物理或概念实体。); • 每个资源(resource)可以是一个或多个类(classes)中的成员;(注:作为属性值的资源所在的类(class)常被称为编码体系词表(vocabulary encoding scheme)); • 每个属性(property)和类(class)均具有其被声明的语义; • 每个类(class)通过限定(子类)关系与一个或多个其它类相关(当两个类共享部分语义(semantics)时,所有属于子类(sub-class)的资源(resource)同时也是另一个相关类(class)的成员; • 每个属性只能与一个其它属性通过限定关系(子属性)相关(当两种属性共享部分语义时,子属性的的有效值也就是相关属性的有效值)。 DCMI 元数据描述的抽象模型如下: • 一个条描述(description)是由一个或多个陈述(statements)(该陈述仅与一个且唯一一个资源有关),以及零个或一个资源的URI 组成(URI 用来标识所描述的资源); • 每个陈述由一个属性URI(这里的URI 用于标识一个属性),零个或一个值URI(这里的URI 用于标识属性的值),零个或一个编码体系URI(这里的URI 标识值的类),零个或多个值的表述(representations)组成; • 每个属性都是被描述资源的一项特性; • 每个属性URI 可以在多个陈述中重复; | |
|
| 5楼 • 值的表述(value representation)可以是字串值(value string)、复合值(rich value)或相关描述(related description)等形式;• 每个字串值都是一个简单的、人类可读的字符串,用以表示属性的值; • 每个字串值可以有相应的编码体系URI( encoding scheme URI),用来标识一个语法编码体系; • 每个字串值可以有相应的字串语种(value string language),它是一个ISO 语种标记(例如,en-GB); • 每个复合值(rich value)是一些标记文本、图像、视频、音频等,或者它们的组合,表示作为属性值的资源;每条相关资源描述都是一个用来描述属性值的资源。 36. 为什么需要DC 元数据抽象模型? |