关于Lucene Collector

Lucene Collector用于收集搜索之后的文档,可以方便做filter等,主要接口有setScorer,collect,setNextReader,acceptsDocsOutOfOrder。

一般和scorer配合使用,acceptDocsOutOfOrder这个选项很重要,表明是否接受doc id乱序,返回true的话对于or操作,不需要从堆中选最小的将快很多,但对于分页时如果指定顺序和scorer界限,可以让分页不重复,这是个好处。

setNextReader一般设置docBase,collect是实际的收集操作。collector有几个sub class:

TopDocsCollector,TopScoreDocCollector,TopFieldCollector,TimeLimitingCollector,PositiveScoresOnlyCollector,CachingCollector,MultiCollector,其中重点关注TopScoreDocCollector,根据是否acceptOutOfOrder一起是否paging after,有InorderTopScoreDocCollector,InOrderPagingScoreDocCollector,OutOfOrderTopScoreDocCollector,OutOfOrderPagingScoreDocCollector。

吐槽一下:今天发现项目中根本没有scorer,而search时又又scorer的重复记分,search engine完全退化成布尔检索器,好像很奇葩。。

scorer根本不应该分开啊,这架构真奇怪。就应该没人维护一个search服务,哪能什么都想通用。。。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值