此章的基本内容如下
- 概念上的索引模型
- 索引的基本操作
- 在索引的时候,提升文档(Document)和字段(Field)的权重
- 索引日期,数字和搜索结果排序的字段(Field)
- 了解和使用影响索引性能和资源消耗的参数
- 优化索引
- 理解并发(Concurrency),多线程和锁的问题
- 高级的索引功能
你想要在硬盘中搜索已存储的文件,或者搜索邮件,网页,甚至是数据库中的数据。Lucene可以帮助你实现这些。然而,当你要搜索之前,你必须先进行索引。这就是这章你要学习的内容。
在第一章,你看到了一个简单的索引例子。本章会更进一步学习,教你使用索引的更新,一些索引中常用的参数,以及其他索引相关的知识。这样能帮助你更好的使用Lucene。在此你也可以知道的内容,如索引的结构,多线程和多进程访问索引要注意的事情,在NFS共享一个索引,以及Lucene锁的机制来避免并发索引的修改。
尽管细节上,我们将带领你创建索引文档(document),但不要忘了最重要的是,索引仅仅是实现目标的一个方法。要关注的是呈现给用户的搜索体验;索引仅仅是为了实现这一目标的一个过程。因此关于索引有很多有用的细节问题,但是你的时间最好花在怎样提升用户的搜索体验。最近有很多应用,搜索要远远重要于索引。也就是说,许多重要的搜索元素需要你在索引的时候使用正确的方法,这么做才可以进行下一步的搜索功能。