一、下载ANSJ的jar包
链接:https://pan.baidu.com/s/16uvyRWw5YqYzeWH43ndViw 密码:ik48
二、
① 将下载下来的jar包放到tomcat下solr项目的lib包内
注:ANSJTokenizerFactory_web4.0.jar这个jar包是自己压缩的
② 将stop.dic 放到..solr-home\configsets\conf\文件夹中
三、修改managed-schema配置文件
- 在<schema></schema>标签内加上如下配置:
<fieldType name="text_ansj" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.ansj.solr.AnsjTokenizerFactory" isQuery="false" stopwords="stop.dic" sync="chineseWordParticiple.properties"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stop.dic" />
</analyzer>
<analyzer type="query">
<tokenizer class="org.ansj.solr.AnsjTokenizerFactory" />
</analyzer>
</fieldType>
- 详细解析:
① 名称任意,保持唯一
② 固定值,不需要修改
③ 索引的配置
④ 该ANSJTokenizerFactory_web4.0.jar文件中AnsjTokenizerFactory.class的路径
⑤ 添加索引的时候是否分词
⑥ 停用分词,指向的是..solr-home\configsets\conf\中的stop.dic这个文件
⑦ 指向ANSJTokenizerFactory_web4.0.jar中的文件
注:chineseWordParticiple.properties文件中的内容
⑧ 是否忽略大小写
⑨ 查询的配置