Lucene+Heritrix学习笔记系列(一)

打算花一个月的时间好好看看Lucene的东西。

一、关键概念:

1. Term

2. Document:

3. Segment: 逻辑概念,可能包含多个Document,每个segment内的所有索引文件都具有相同的前缀。一个Index可能有多个Segment,其是Lucene对索引管理的最大单位。

4. Query

5. Field

6. Index

7. Search

8. Posting

9. Boost

10. Hits

11. Filter

12. Sort

13. HitCollector

14. Weight

15. IndexReader&IndexWriter


二、索引文件后缀说明

.fdt


参考资料:

1. http://hi.baidu.com/iduany/item/cc0a4ddb0baa0cef55347f72 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值