- Java
文章平均质量分 92
KeViNOne
生活,就是这样,永远占领着绝对的领导地位。当无数的傻子高呼着自己控制了生活自己掌握了命运,却没有看到,生活站在更高的苍穹之上,露出的讥笑嘲讽的面孔~~~
如果记忆如钢铁般坚固 我该微笑还是哭泣
如果钢铁如记忆般腐蚀
那这是欢城还是废墟~~~~~~
展开
-
Lucene 4.0 原理与代码分析
Lucene是全世界最优秀的全文搜索引擎之一,其鼎鼎大名只要是对搜索有一定了解的朋友都一定会有所耳闻,他有着非常优秀的性能和可扩展性,因此有很多身份显赫的后代,比如Solr和Nutch,都是apache基金会下的顶级项目,其已成为工业搜索引擎的基础,可谓是搜索引擎的“事实标准”;于此同时,由于apache基金会的优良运作以及apache开源协议的友好支持,成千上万的搜索技术发烧友和爱好者为Luce原创 2012-09-05 16:09:11 · 771 阅读 · 0 评论 -
Lucene 4.0 原理与代码分析 - 相似度评分算法之向量空间模型(VSM)
搜索算法的核心实际是对搜索项之间相似度的打分策略,一个好的打分策略应该能够综合各种与搜索项内容相关并对搜索目的有帮助的所有因素,一般将这种策略叫做建模(modeling),由量化后的相关因素即特征(feature)构成检索(评分)模型,最后通过模型得到搜索项之间的相似度分数(similarity score)。 一般来讲相似度分数应该是与内容相关的程度成正比的,因此当计算过所有的搜索项的相似原创 2012-09-05 17:00:40 · 3574 阅读 · 0 评论