![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Lucene系列
iteye_12007
这个作者很懒,什么都没留下…
展开
-
Lucene的同步法则
避免出现同步问题: 1、在同一时刻,Lucene的索引只允许有一个进程对其进行加入文档、删除文档、更新索引等操作。 2、在同一时刻,Lucene的索引允许多个线程同时对其进行检索。也即: 1、任一时刻,在系统中只能有一个IndexWriter的实例对索引进行操作不允许有多个IndexWriter向索引添加Document,或是优化索引、合并segmen...原创 2011-07-11 20:34:16 · 154 阅读 · 0 评论 -
TF/IDF算法
一直说TF-IDF,终于开始做真正的TF-IDF。TF/IDF(term frequency/inverse document frequency) 的概念被公认为信息检索中最重要的发明。一。TF/IDF描述单个term与特定document的相关性TF(Term Frequency): 表示一个term与某个document的相关性。公式为这个term在documen...原创 2011-10-07 09:19:20 · 161 阅读 · 0 评论