- 博客(3)
- 资源 (2)
- 收藏
- 关注
原创 Lucene SandBox包中highlighter(高亮显示搜索结果包)存在的问题
highlighter包从官方网站下载编译就有几个.java文件错误,估计需要完全编译整个Sandbox,而我只编译了highlighter使得有些问题,但highighter.java的getBestTextFragments()始终有问题,而且在网络上查到lucene-highlighter可以很好的解决英文高亮的问题,但是对中文分词算法的高亮就会存在严重的问题。比如使用CJ
2009-07-11 06:48:00 1490
原创 关于Lucene SandBox包的下载问题
学习Lucene中我在网络上查阅的关于Lucene方面的内容,其中有些学习资料表述( lucene包括core和sandbox两部分,其中core是lucene稳定的核心部分,sandbox包含了一些附加功能,例如highlighter、各种分析器。),其中core包可以从http://lucene.apache.org/很容易找到,但sandbox确找了很久都没有结果,最后发现http://lu
2009-07-09 21:21:00 1509
原创 中文分词 JE-Analysis 组件使用外部自定义词典
JE-Analysis分词组件的一大特色就是可以添加词以及使用词典以扩张起自己带的词库,使得分词更加准确.下面就是使用外部词典代码:import java.io.IOException;import jeasy.analysis.MMAnalyzer;import java.io.FileNotFoundException;import java.io.FileReader;pu
2009-07-04 19:58:00 2498 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人