探究Lucene计算权重的过程

探究Lucene计算权重的过程 我们知道,影响一个词在一篇文档中的重要性主要有两个因素: 1 term frequency (tf):该词在当前文档出现了多少次,tf越大,说明越重要。 2 document frequency (df):有多少文档包含该term,该词越大说明太普通了,越不重要。 ...

2016-05-14 22:14:40

阅读数 3107

评论数 0

Lucene 初探

1.1   Lucene 是什么 Lucene是一款信息检索工具库或者全文检索库。 1.2   Lucene能做些什么 Lucene只是一个软件类库或者工具箱,并不是一个完整的文件搜索程序,或者网页搜索器以及网站搜索引擎。很多完整的搜索程序都是基于lucene这个核心来运行 1.3   结...

2016-05-14 20:30:04

阅读数 505

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭