Dspace系统文档(选译)
糊涂小三
一、 简介
Dspace是一个开软软见平台,它具有如下功能:
● 通过使用工作流提交模块或者一系列的规范获取接口获取和表述数字资源。
● 使用搜索系统和检索,通过网络的方式发布机构所拥有的数字资产。
● 长期保存数字资产。
Dspace系统文档对系统功能作了一个整体的描述。它对Dspace系统进行了一个良好的性能描述,为非技术人员学习使用Dspace系统是一个良好的导向。在阅读整个系统文档之前,读者应该首先阅读这一部分内容,因为该部分内容包括许多后续文档中用到的术语。
对于需要运行Dspace系统的用户来说,文档提供了安装指南,以及如何配置系统以及介绍系统目录结构的相关内容。注意:自从Dspace1.2版本之后,系统就提供了有关用户接口管理的在线帮助手册。
最后,为了那些Dspace系统爱好者能更好的了解Dspace系统如何工作,为了使使用者能根据具体应用对Dspace系统进行修改使用,文档中提供了Dspace详细系统架构和设计部分的内容。
Dspace系统文档还提供了如下一些有用的信息。
Dspace Public API Javadocs
Dspace Wiki:A list of DSpace resources
FAQ: Technical FAQ
Projects: A list of projects using DSpace
Guidelines: Guidelines for contributing back to DSpace
二、 Dspace功能介绍
1.Data Model(数据模型)
Dspace系统中数据组织方式能很好地反映一个组织的结构。每个Dspace站点被分成若干个Communities,每个community对应一个实验室、研究中心、或者部门。
Communities由Collections组成,这些Collections将相关的内容(数字资产)分组。一个Collection可能同时出现在几个不同的Communities中。
一个Collection由多个item组成。
2. Metadata(元数据)
一般来说,Dspace系统支持三种类型的元数据
(1) Descriptive metadata(描述元数据)
每一个条目(item)包含一个规范的DC元数据记录。MIT实验室使用的元素和限定词集合是一个Dspace源代码默认的配置。
另外的关于条目(item)的描述元数据存在于一系列的Bitstream中。Communities和Collections也包含一些简单的描述元数据,这些元数据存储于DBMS中。
(2) Aministrative Metadata(管理元数据)
管理元数据包括保存元数据(preservation metadata)、起源数据(provenance)以及授权政策数据(authorization policy)。大部分数据于Dspace的关系数据库管理系统模式中。起源元数据(provenance metadata)存储于DC元数据记录中。此外,其他的管理元数据被复制到DC元数据记录中以便Dspace系统访问者能够轻松实现数据访问。
(3) Structural Metadata(结构元数据
结构元数据包含如下信息:条目(item)描述信息、条目内部的字节流(bitstream)描述信息、条目各组成部分之间的关系信息(对最终用户而言)。例如:假定一篇论文由若干TIFF格式的图片构成,每一张图片表示论文的一页;那么,结构元数据将包含如下信息:每一个图片由一个单独的页面构成;每个页面或者图片在论文中的位置。
3.Eperson(电子用户)
Dspace电子用户的功能:控制资料提交、系统管理权限等。
Dspace系统中,每个e-person由如下信息构成:E-mail地址、姓名、是否允许用户通过WebUI登陆系统、用户密码、是否是用户自己注册、network ID等。
4.Authorization(授权)
Dspace授权系统与EpersonGroup和ResourcePolicy紧密联系。
Dspace系统包含两个特殊的组(Groups):“administrator”(能对系统进行任何操作)和“anonymous”(包含所有用户的表列)。
Assigning a policy for an action on an object to anonymous means giving everyone permission to do that action.
对一个对象的一个操作(action)指派一个“anonymous”意味着允许系统的所有用户执行指定操作。
目前,Dspace系统的Collections、Communities以及Items都是可以公开浏览的。仅仅在阅读全文内容时受到阅读权限控制。
Community:
ADD/REMOVE 添加/删除Community中的collections/sub-communitis
Collection:
ADD/REMOVE 添加/删除items
DEFAULT_ITEM_READ inherited as READ by all submitted items
DEFAULT_BITSTREAM_READ inherited as READ by bitstreams of all submitted items
COLLECTION_ADMIN 编辑条目(edit items)、删除条目(withdraw items)、map other items into this collection
Item:
ADD/REMOVE 添加/删除条目(items)
READ 浏览条目内容(view item)
WRITE 修改条目内容(modify item)
BUNDLE:
ADD/REMOVE 从Bundle(包)中删除字节流(bitstream)
BITSTREAM:
READ 浏览Bitstream
WRITE 修改Bitstream
5.Ingest Process and Workflow
DSpace Ingest Process
InprogressInformation:该类封装了将要导入dspace数据库系统的Item的所有内容。可以通过三种方式将item导入到Dspace系统中;
WebUI接口提交Item
Batch Item Importer 批量导入
直接对Dspace DBMS Table 进行数据写入。该方法安全性不好,如果对Dspace系统架构不熟悉的话,不建议使用。
The Item Installer:
指派一个访问日期(Accession Date)
把字段“date.available”的值添加到Item的DC元数据记录中(Dublin Core Medatadata Record of Item)
添加发行日期(如果元数据记录中没有)(issue date)
添加provenance message(含bitstream checksums)
添加items到指定的collections,同时添加合适的授权信息(authorization policies)
创建新增items的浏览和检索索引
6.Workflow Steps(工作流步骤)
一个Collection的工作流workflow 可以分为三个步骤。每一个Collection都存在一个相关的e-person group 来执行相应的步骤。如果没有e-person group与相应的步骤(step)对应,那么该步骤将被跳过(skipped)。如果一个Collection的任何步骤都没有与一个e-person group相关联,那么Collection的提交信息将被直接载入档案。
换句话说(In other words),workflow的工作顺序如下:The collection receives a submission. If the collection has a group assigned for workflow step 1, that step is invoked, and the group is notified. Otherwise, workflow step 1 is skipped. Likewise, workflow steps 2 and 3 are performed if and only if the collection has a group assigned to those steps.