1.用lucene 2.0建索引应该是不支持分布式的因为lock文件所存储路径是由System.getProperty("java.io.tmpdir") 详见 FSDirectory.java
,如果有多台机器向一台机器上建索引就会出现问题了。如果要支持分布式则应该将 lock的路径指向一个每台机器都能访问到的网络路径。
2.文档得分的计算:
可以设置document的boost值,也可以设置field的boost值。field的boost值与document的boost值是相互独立的,并不相互影响。并且最后计
算用到的field的boost是用该field的boost值乘以所在的document的boost值。所以field的boost值和document的boost值都会对最后的得分产
生影响。并且计算好之后最终的boost值是写到索引文件中的,也就是说boost的计算是在建立索引阶段完成的,此外各个词条所在文档的词频
的计算也是在索引阶段完成的,并写在索引文件中的,而最终该文档的得分,是在搜索阶段依据所搜索的内容,再计算其他的df,idf等等最后
依据公式乘上索引阶段所取得的boost值最后的到对应所搜索的内容的的分。
,如果有多台机器向一台机器上建索引就会出现问题了。如果要支持分布式则应该将 lock的路径指向一个每台机器都能访问到的网络路径。
2.文档得分的计算:
可以设置document的boost值,也可以设置field的boost值。field的boost值与document的boost值是相互独立的,并不相互影响。并且最后计
算用到的field的boost是用该field的boost值乘以所在的document的boost值。所以field的boost值和document的boost值都会对最后的得分产
生影响。并且计算好之后最终的boost值是写到索引文件中的,也就是说boost的计算是在建立索引阶段完成的,此外各个词条所在文档的词频
的计算也是在索引阶段完成的,并写在索引文件中的,而最终该文档的得分,是在搜索阶段依据所搜索的内容,再计算其他的df,idf等等最后
依据公式乘上索引阶段所取得的boost值最后的到对应所搜索的内容的的分。