数字图书馆开发
文章平均质量分 66
liuxun02
这个作者很懒,什么都没留下…
展开
-
Lucene学习笔记
1. 如何将文件系统中各种类型(HTML、TXT、RTF、PDF、DOC等)的文件转化为Lucene索引(Index)所支持的Document类型? 2. 仔细分析Lucene实现全文检索的基本原理。 3. 如何扩展Lucene分析器(Analyzer)使其支持多语言?分析相对成功的中文分词系原创 2007-01-10 18:00:00 · 1621 阅读 · 0 评论 -
基于OAI-PMH的元数据搜索引擎的设计与实现
在设计和实现基于OAI-PMH的元数据搜索引擎过程中,需要解决很多方面的问题。对于中小型搜索引擎,最好使用开放源代码软件来实现。一、实现基于OAI-PMH的元数据搜索引擎,我采用了如下开放源代码软件:(1)OAIHarvester:从支持元数据资源开放的DataProvider获取元数据资源。(2) HTMLParser:用于解析HTML页面,并从中解析出可以有效获取与元数据对应的原创 2007-01-16 18:23:00 · 2224 阅读 · 0 评论 -
Dspace数字资产管理系统应用开发指南
Dspace数字资产管理系统应用开发指南摘要:本文主要介绍Dspace数字资产管理系统中应用到的开放源代码软件和技术,对修改和定制Dspace系统提供一些向导性建议,同时提供部分Dspace系统改造方案。关键词:Dspace;Lucene;系统结构;OAIHarvester;OAICat;Log4J;PDFBox;tm-extractor;定制;修改;1.准备工作 在修改原创 2007-03-05 13:24:00 · 4561 阅读 · 5 评论 -
Dspace系统文档(中文)
Dspace系统文档(选译)糊涂小三一、 简介 Dspace是一个开软软见平台,它具有如下功能:● 通过使用工作流提交模块或者一系列的规范获取接口获取和表述数字资源。● 使用搜索系统和检索,通过网络的方式发布机构所拥有的数字资产。● 长期保存数字资产。Dspace系统文档对系统功能作了一个整体的描述。它对Dspace系统进行了一个良好的性能描原创 2007-02-05 11:09:00 · 9847 阅读 · 4 评论 -
数字图书馆发展趋势及其需要解决的问题(概要)
数字图书馆发展趋势及需要解决的关键问题一、图书馆的发展趋势面向知识的主动服务1 知识与信息 21世纪是知识经济时代。互联网时代,是信息爆炸式发展的时代。 我们缺乏知识,不缺乏信息。 信息:广义的概念,包括用户需要的和不需要的信息。 知识:我们想要得到的信息,或者说能满足我们使用需求的信息。如果我们获取了我们想要的信息,那么我们就获得了知识。2 服务定位 面向知识的服务:用户需要什么原创 2007-06-10 15:49:00 · 1556 阅读 · 0 评论