不介绍:
lucene全文本搜索引擎:http://lucene.apache.org/
ansj_seg分词器: https://github.com/NLPchina/ansj_seg
怎么下载?怎么使用?下载后都有demo的。
这里只说关键的:
1.把lucene的lucene-analyzers-common-7.4.0.jar、lucene-core-7.4.0.jar和lucene-queryparser-7.4.0.jar导入项目中。
2.下载ansj_seg分词器的最新版本,及其配套的分nlp-lang。具体详细要求,看github中的详细解释。
3.在项目中导入ansj_seg-master\plugin下对应lucene版本的插件,我的是7所以是文件夹ansj_lucene7_plugin。
图中的org.ansj.lucene.util和org.ansj.lucene7包中的文件是直接从插件中复制过来的。
4.导入ansj_seg的ansj_seg-5.1.6.jar和nlp-lang-1.7.7.jar。
5.关键的部分,在src目录下建立和ansj配置文件同名的配置类。就是上图的library.java,注意不要放在任何包下。默认的就行。
关键的代码来了,如何让ansj_seg启动时读取该配置类。
impo