Dspace数字资产管理系统应用开发指南
摘要:本文主要介绍
Dspace
数字资产管理系统中应用到的开放源代码软件和技术,对修改和定制
Dspace
系统提供一些向导性建议,同时提供部分
Dspace
系统改造方案。
关键词:
Dspace;Lucene;
系统结构
;OAIHarvester;OAICat;Log4J;PDFBox;tm-extractor;
定制
;
修改
;
1.准备工作
在修改和定制
Dspace
系统之前,我们需要对
Dspace
系统及其相关的背景知识有比较系统和详尽的理解。
(
1
)
Dspace
系统的功能。
Dspace
系统主要用于数字资产的长期保存和管理,它也向用户提供浏览和检索服务,同时,它还为支持
OAI-PMH
协议的元数据获取软件(如:
OAIHarvester2.0
)提供元数据服务。
(
2
)
Dspace
的系统结构。
Dspace
系统是按照三层结构来设计的,他们分别是存储层(
Storage Layer
),业务逻辑层(
Business Logical Layer
)和应用层(
Application Layer
)。其中,存储层主要由软件包:
org.dspace.storage.rdbms.*
和
org.dspace.storage.bitstore.*
构成;应用层主要由软件包:
org.dspace.app
目录下的所有软件包构成;其他的软件包构成业务逻辑层。在实际应用中,应用层程序调用业务逻辑层和存储层程序来实现用户所需要的各种功能。由于《
Dspace
系统文档选译》一文中对
Dspace
系统架构由详细的描述,这里不在赘述。
(
3
)熟悉
Dspace
软件包各个类的功能特征是使用这些类进行二次开发的必要条件。这些类主要有:
Community,Collection,Item,Bitstream,Bundle,Handle,EPerson,Group,ResourcePolicy,Context,ConfigurationManager
等。
(
4
)认识和理解
Dspace
系统使用到的开放源代码软件及软件包。
Dspace
系统是一个开放源代码的网络应用,它在开发过程中使用了大量的开放源代码软件,如果能够对
Dspace
系统中使用到的
Dspace
源代码软件有很好的认识,那么,不仅对我们修改定制
dspace
系统大有好处,而且对我们深入认识和掌握
Java
语言开发应用程序有极大帮助。下面,简要介绍一下
Dspace
系统中用到的开放源代码软件:
OAICat
:由
OCLC
开发,作为
Dspace
系统的数据提供者
(Data Provider)
向支持
OAI-PMH
协议的服务提供者(
Service Provider
)提供元数据资源。这将有利于组织之间元数据的交流与共享,加快元数据互操作的发展进程。
Lucene
:
Dspace
系统用于实现全文检索功能的开源搜索引擎软件包。它为进入
Dspace
系统的元数据及其对应的部分全文(主要是
PDF
,
DOC
,
TXT
,
HTML
)提供索引和检索机制。
Log4J
:对于一个基于网络的应用系统来说,日志统计功能不可或缺。
Dspace
系统使用
Log4J
实现日志统计功能。
Log4J
是
Apache
的一个开放源代码项目,是一个日志操作包。通过使用
Log4J
,可以指定日志信息输出的目的地,还可以控制每条日志信息的输出格式以及日志信息的级别,非常细致地实现日志统计功能。
OAIHarvester
:
OAIHarvester
并非
Dspace
系统使用到的开源软件,但它是一个基于
OAI-PMH
协议的开放元数据获取软件,因此有必要介绍一下。
OAIHarvester2.0
是基于
OAI-PMH2.0
协议的开放元数据获取软件。
OAIHarvester2.0
是