lucene 学习

最新推荐文章于 2024-07-19 15:22:03 发布

surenyong

最新推荐文章于 2024-07-19 15:22:03 发布

阅读量293

点赞数

文章标签： lucene 文档存储网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/surenyong/article/details/3067633

版权

1.用lucene 2.0建索引应该是不支持分布式的因为lock文件所存储路径是由System.getProperty("java.io.tmpdir") 详见 FSDirectory.java
，如果有多台机器向一台机器上建索引就会出现问题了。如果要支持分布式则应该将 lock的路径指向一个每台机器都能访问到的网络路径。
2.文档得分的计算：
可以设置document的boost值，也可以设置field的boost值。field的boost值与document的boost值是相互独立的，并不相互影响。并且最后计

算用到的field的boost是用该field的boost值乘以所在的document的boost值。所以field的boost值和document的boost值都会对最后的得分产

生影响。并且计算好之后最终的boost值是写到索引文件中的，也就是说boost的计算是在建立索引阶段完成的，此外各个词条所在文档的词频

的计算也是在索引阶段完成的，并写在索引文件中的，而最终该文档的得分，是在搜索阶段依据所搜索的内容，再计算其他的df，idf等等最后

依据公式乘上索引阶段所取得的boost值最后的到对应所搜索的内容的的分。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
lucene 学习

1.用lucene 2.0建索引应该是不支持分布式的因为lock文件所存储路径是由System.getProperty("java.io.tmpdir") 详见 FSDirectory.java，如果有多台机器向一台机器上建索引就会出现问题了。如果要支持分布式则应该将 lock的路径指向一个每台机器都能访问到的网络路径。2.文档得分的计算：可以设置document的boost值，也可以设置fiel
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。