lucene boost 的誤解

5 篇文章 0 订阅

之前一直以为,无论在index或搜索时,如果boost为0,結果将不会得出。但今天经过测试,不是这样的。

来看它的评分公式吧,其中一项就是 queryNorm(q) ,它是这样计算的:

 1/sumOfSquaredWeights½

 但这样可能遇到分母为0的情况,于是在Query中的weight()中作了修正 :如果是infinite则为1.

 不过,由此我又想到了是否出现异常的情况,发现,如果是1/0这种情况是会有异常的;但如果是float或double不会出现异常,只是返回Infinity 。

 

不过,造成评分結果为0 的原因 并不是上述 的fatcor,而是公式后面的求和项引起 的。

score(q,d)   =   coord(q,d)  ·  queryNorm(q)  ·  ( tf(t in d)  ·  idf(t) 2  ·  t.getBoost()  ·  norm(t,d) )
t in q

其中t.getBoost()时搜索的; norm()是索引时的field boost和查询时的doc boost构成 。

 

总之,score为0时只表明在similarity上不会加分,所以如果确实某些查询不需要这情况时,可以作为filter而不是query来提交效率。

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值