1. 如何将文件系统中各种类型(HTML、TXT、RTF、PDF、DOC等)的文件转化为Lucene索引(Index)所支持的Document类型?
2. 仔细分析Lucene实现全文检索的基本原理。
3. 如何扩展Lucene分析器(Analyzer)使其支持多语言?分析相对成功的中文分词系统CJKAnalyzer和ICTLAS的分词功能。
4. 使用索引浏览器Luke(Lucene Index ToolBox)和索引监视器LIMO(Lucene Index Monitor)管理Lucene的索引文件。
http://www.getopt.org/luke/
获取Luke相关信息。使用Eclipse运行。
http://limo.sourceforge.net
获取Limo相关信息。使用tomcat运行。
5. 使用OAIHarvester2.0和Lucene构建元数据搜索引擎。
6. 分析数字资产管理系统Dspace是如何使用Lucene 实现检索功能的?
7. 使用Lucene命令行接口LUCLI(Lucene Cmmand-Line Interface)。LUCLI是通过命令行操作索引信息的第三方工具。
获取lucene沙箱工具(sandbox)。使用Eclipse运行。