jieba分词是中文里面比较好的分词器,而当前Elasticsearch官方并不支持jieba分词,但可以通过配置plugins的方式使用jieba分词器作为es的analyzer。
配置环境:
- mac os 10.12
- elasticsearch 5.3.0
- jieba 5.3.0 (与es版本匹配)
- 首先需要下载针对es的jieba分词插件,当前jieba分词插件对es的支持情况如图:
- 自动化打包构建jieba分词插件,需要提前下载gradle工具
# 找到下载文件,解压
tar -xzvf elasticsearch-jieba-plugin-5.3.0.zip
# 进入文件夹
cd elasticsearch-jieba-plugin-5.3.0
# gradle进行编译
gradle pz
- 拷贝生成的包至Elashticsearch安装路径下的plugins路径
cp build/distributions/elasticsearch-jieba-plugin-5.3.0.zip ${elasticsearch_home}/plugins
- 解压缩文件并删除压缩包
unzip elasticsearch-jieba-plugin-5.3.0.zip
rm elasticsearch-jieba-plugin-5.3.0.zip
- 重新启动ES服务
./bin/elasticsearch
- jieba分词器在索引配置时的使用
- es配合jieba分词器,可以组合产生更加强大的功能,如配置停用词、同义词等。
版本不兼容的处理方法
如某些版本无直接对应的jieba分词器版本,修改plugins中jieba文件夹中plugin-descriptor.properties文件中的两个配置项为需要的版本:
version=x.x.x
elasticsearch.version=x.x.x
交流
欢迎添加公众号与我交流!