Elasticsearch2.2.0安装ik中文分词

ik中文分词插件官网

https://github.com/medcl/elasticsearch-analysis-ik

下载和您ES匹配的版本,现在已经支持最新的2.2.0版本

源码压缩文件解压到任意文件夹

1、首先将源代码用maven打包,这个打包不用必须在服务器上,

   安装配置好maven后,进入源码所在文件夹执行如下命令

     mvn clean package

    打包命令会下载很多依赖的包,会比较慢

2、命令执行成功后在源码路径下生成如下目录,

    elasticsearch-analysis-ik-master\target\releases

    找到这个文件   elasticsearch-analysis-ik-{version}.zip

3、将第二部的zip文件解压缩到elasticsearch 安装目录的如下目录中,没有ik目录则手动建立

 elasticsearch-2.2.0/plugins/ik

3、启动elasticsearch即可

  ./bin/elasticsearch

4、验证

浏览器输入类似如下地址,ip端口,yang是索引

http://192.168.0.128:9200/yang/_analyze?analyzer=ik&pretty=true&text="我是中国人" 

能够显示如下信息则说明安装正确

{
    tokens: [
        {
            token: "我",
            start_offset: 0,
            end_offset: 1,
            type: "CN_CHAR",
            position: 0
        },
        {
            token: "中国人",
            start_offset: 2,
            end_offset: 5,
            type: "CN_WORD",
            position: 1
        },
        {
            token: "中国",
            start_offset: 2,
            end_offset: 4,
            type: "CN_WORD",
            position: 2
        },
        {
            token: "国人",
            start_offset: 3,
            end_offset: 5,
            type: "CN_WORD",
            position: 3
        }
    ]
}

5、插入数据,此处用curl方式插入数据需要注意中文编码问题,此处我用fiddler插入

25090326_tbO2.jpg

连续插入多条相同数据,尝试查找执行如下命令

6、查找,关键词北京

25090326_ik7q.jpg

7、结果json,关键词高亮

{
    "took": 196,
    "timed_out": false,
    "_shards": {
        "total": 5,
        "successful": 5,
        "failed": 0
    },
    "hits": {
        "total": 3,
        "max_score": 2,
        "hits": [
            {
                "_index": "index",
                "_type": "fulltext",
                "_id": "4",
                "_score": 2,
                "_source": {
                    "content": "中华人民共和国,北京天安门"
                },
                "highlight": {
                    "content": [
                        "中华人民共和国,<tag1>北京</tag1>天安门"
                    ]
                }
            },
            {
                "_index": "index",
                "_type": "fulltext",
                "_id": "5",
                "_score": 0.61370564,
                "_source": {
                    "content": "中华人民共和国,北京天安门"
                },
                "highlight": {
                    "content": [
                        "中华人民共和国,<tag1>北京</tag1>天安门"
                    ]
                }
            },
            {
                "_index": "index",
                "_type": "fulltext",
                "_id": "3",
                "_score": 0.61370564,
                "_source": {
                    "content": "中华人民共和国,北京天安门"
                },
                "highlight": {
                    "content": [
                        "中华人民共和国,<tag1>北京</tag1>天安门"
                    ]
                }
            }
        ]
    }
}



转载于:https://my.oschina.net/UpBoy/blog/620004

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值