elasticsearch中文分词

默认的中文分词,是将中文拆分成每一个字,这样拆分是个很糟糕的事情



 
GET  _analyze 
{
  "analyzer":"ik_max_word",
  "text":"南阳市" 
}


get  _analyze 
{
  "analyzer":"ik_smart",
  "text":"南阳市" 
}

此时,引入中文分词器


打开这个github页面

GitHub - medcl/elasticsearch-analysis-ik: The IK Analysis plugin integrates Lucene IK analyzer into elasticsearch, support customized dictionary.https://github.com/medcl/elasticsearch-analysis-ik





然后在root用户下,切换到  es根目录/plugins目录下,如/usr/local/elasticsearch/plugins


创建ik文件夹


使用winscp工具将下载包解压后的文件传到ik目录下 


然后启动elasticsearch,紧接着启动kibana




put xuhaitao/huaxue/1
{
  "id":1,
  "name":"高中高一化学",
  "age":36
}

put xuhaitao/huaxue/2
{
  "id":2,
  "name":"化学不等式",
  "age":32
}

put xuhaitao/huaxue/3
{
  "id":3,
  "name":"高中数学精解",
  "age":31
}

get xuhaitao/huaxue/_search 
{
    "query":{
      "match": {
        "name": "高中"
      }
    }
}


{
  "took": 5,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": 2,
    "max_score": 0.68324494,
    "hits": [
      {
        "_index": "xuhaitao",
        "_type": "huaxue",
        "_id": "1",
        "_score": 0.68324494,
        "_source": {
          "id": 1,
          "name": "高中高一化学",
          "age": 36
        }
      },
      {
        "_index": "xuhaitao",
        "_type": "huaxue",
        "_id": "3",
        "_score": 0.5753642,
        "_source": {
          "id": 3,
          "name": "高中数学精解",
          "age": 31
        }
      }
    ]
  }
}

FR:徐海涛(hunk Xu) 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值