0.背景
公司目前业务系统偏向后台系统,目前包含500W+数据,在许多列表中支持各种条件查询,含有大量的模糊搜索条件。由于在mysql中模糊查询效率低下,目前公司已使用es搜索引擎进行条件搜索。es版本如下:
elasticsearch版本:6.3.2
java client版本:rest-high-level-client 6.3.2
问题:业务需要部分中文字段进行a-z拼音排序。
1.实现方案
网上查阅资料,es使用elasticsearch-analysis-pinyin分词插件可实现排序效果。具体原理是通过拼音分词器将汉字分为只含有首字母的字符串(例如:刘德华----> ldh),之后通过查询此分词字段实现排序。
2.说干就干
2.1下载、安装拼音分词器
elasticsearch-analysis-pinyin下载网址:github.com/medcl/elast…
根据自己的es版本下载对应的拼音分词器版本,由于我的是6.3.2的版本,因此下载master版本的分词器。
解压zip包,命令行移动到解决后的包下,执行mvn 打包命令(没有maven的自行下载):
mvn打包命令: mvn package
看到 BUILD SUCCESS
即为打包成功。
此时,target
目录已经生成,进入E:\Elasticsearch\elasticsearch-analysis-pinyin-master\target