Lucene的全文检索可以分为两步:1)建立索引。2)检索索引。
建立索引要用到IndexWriter,Document.Field等Lucene包中的类。建立索引按以下步骤进行。
a.读入需要建立索引的文件流。
b.用指定的语言分析器(Analyzer)构造一个新的写索引器IndexWriter。
c.把读入的文件流放入Field类中。
d.把b做成的Field加入到Document.
e.把做好的文档Document写入索引IndexWriter。
通过上述五步就做好索引了,只不过这是最简单的情况,如果作中文检索的话,就需要自己实现语言分析器。
IndexWriter 这个类主要负责建立修改索引。Lucene也提供其它的类完成这个功能
Directory 它是索引存储路径的抽象,它有2个子类,FSDirectory文件系统路径 RAMDirectory内存路径
Analyzer 文本分析器,分析需要锁定的文本。
Document 被索引文件的一个抽象,包括很多Field
Field是Document的一个组成部分,具有4个类型:Keyword, UnIndexed, UnStored, Text
建立索引要用到IndexWriter,Document.Field等Lucene包中的类。建立索引按以下步骤进行。
a.读入需要建立索引的文件流。
b.用指定的语言分析器(Analyzer)构造一个新的写索引器IndexWriter。
c.把读入的文件流放入Field类中。
d.把b做成的Field加入到Document.
e.把做好的文档Document写入索引IndexWriter。
通过上述五步就做好索引了,只不过这是最简单的情况,如果作中文检索的话,就需要自己实现语言分析器。
IndexWriter 这个类主要负责建立修改索引。Lucene也提供其它的类完成这个功能
Directory 它是索引存储路径的抽象,它有2个子类,FSDirectory文件系统路径 RAMDirectory内存路径
Analyzer 文本分析器,分析需要锁定的文本。
Document 被索引文件的一个抽象,包括很多Field
Field是Document的一个组成部分,具有4个类型:Keyword, UnIndexed, UnStored, Text