ik中文分词插件官网
https://github.com/medcl/elasticsearch-analysis-ik
下载和您ES匹配的版本,现在已经支持最新的2.2.0版本
源码压缩文件解压到任意文件夹
1、首先将源代码用maven打包,这个打包不用必须在服务器上,
安装配置好maven后,进入源码所在文件夹执行如下命令
mvn clean package
打包命令会下载很多依赖的包,会比较慢
2、命令执行成功后在源码路径下生成如下目录,
elasticsearch-analysis-ik-master\target\releases
找到这个文件 elasticsearch-analysis-ik-{version}.zip
3、将第二部的zip文件解压缩到elasticsearch 安装目录的如下目录中,没有ik目录则手动建立
elasticsearch-2.2.0/plugins/ik
3、启动elasticsearch即可
./bin/elasticsearch
4、验证
浏览器输入类似如下地址,ip端口,yang是索引
http://192.168.0.128:9200/yang/_analyze?analyzer=ik&pretty=true&text="我是中国人"
能够显示如下信息则说明安装正确
{
tokens: [
{
token: "我",
start_offset: 0,
end_offset: 1,
type: "CN_CHAR",
position: 0
},
{
token: "中国人",
start_offset: 2,
end_offset: 5,
type: "CN_WORD",
position: 1
},
{
token: "中国",
start_offset: 2,
end_offset: 4,
type: "CN_WORD",
position: 2
},
{
token: "国人",
start_offset: 3,
end_offset: 5,
type: "CN_WORD",
position: 3
}
]
}
5、插入数据,此处用curl方式插入数据需要注意中文编码问题,此处我用fiddler插入
连续插入多条相同数据,尝试查找执行如下命令
6、查找,关键词北京
7、结果json,关键词高亮
{
"took": 196,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 3,
"max_score": 2,
"hits": [
{
"_index": "index",
"_type": "fulltext",
"_id": "4",
"_score": 2,
"_source": {
"content": "中华人民共和国,北京天安门"
},
"highlight": {
"content": [
"中华人民共和国,<tag1>北京</tag1>天安门"
]
}
},
{
"_index": "index",
"_type": "fulltext",
"_id": "5",
"_score": 0.61370564,
"_source": {
"content": "中华人民共和国,北京天安门"
},
"highlight": {
"content": [
"中华人民共和国,<tag1>北京</tag1>天安门"
]
}
},
{
"_index": "index",
"_type": "fulltext",
"_id": "3",
"_score": 0.61370564,
"_source": {
"content": "中华人民共和国,北京天安门"
},
"highlight": {
"content": [
"中华人民共和国,<tag1>北京</tag1>天安门"
]
}
}
]
}
}