Lucene
shihuacai
这个作者很懒,什么都没留下…
展开
-
Lucene实战阅读笔记1
Solr Lucene子项目,支持从关系数据库和XML文档中提取原始数据,以及能够通过集成Tika来处理复杂文档。Nutch Lucene子项目,它包含大规模的爬虫工具,能够抓取和分辨Web站点数据。Heritrix 开源的Internet文档搜索程序。Drods Lucene子项目,目前正处于筹备状态。Aperture 它支持从Web站点、文件系统转载 2012-12-10 21:00:13 · 788 阅读 · 0 评论 -
图解lucene TermVector
如果不是Field.Store.YES, 无法保存TermVector.索引数据为Amsterdam has lots of bridges in AmsterdamWhitespaceAnalyzer1 TermVector.YES2 TermVector.WITH_POSITIONS3 TermVector.WITH_OFFSETS转载 2013-09-28 17:39:29 · 2518 阅读 · 0 评论