同学: Lucene1.4终于成功了,要用这个StandardAnalyzer分析器,不用外加中文分析器,它已经集成了。
我: 呵呵,恭喜啊。
我: 你弄了什么外加中文分析器
同学: CJK之类的一大堆,都是车东写的,Lucene1.4已经集成了车东的包。
我: 速度怎么样?
同学: 你把那个Demo的results.jsp的Analyzer analyzer = new StopAnalyzer(); 改为:Analyzer analyzer = new StandardAnalyzer();
我: 有没有编码问题? 譬如 gb2312, gbk的差别
同学: 在index.jsp和results.jsp加上
同学: <%@ page contentType="text/html; charset=gb2312"%>
同学: 就改这三个地方就OK了。
同学: 速度还没办法测试,因为我现在只有几个文件。
我: 好像pdf或者其他一些文件也可以检索的
我: 试过没有
同学: 还没有,我可能要做检索MS office的
我: 是啊,做了这个就可以检查别人上传的文档是不是合乎要求的
Lucene1.4终于成功了
最新推荐文章于 2024-07-30 11:20:51 发布