elasticsearch ik分词实现 中文、拼音、同义词搜索

EasticSearch版本:1.5.2

1、配置分词器:配置IK,参照 《ElasticSearch 安装和使用IK分词器

2、拼音分词器配置:使用已经编译好的:elasticsearch-analysis-pinyin-1.3.0

  2.1、在elasticsearch的plugins目录下,新建analysis-pinyin文件夹,解压上述压缩包,将里面的

  

放到analysis-pinyin文件夹。

  2.2同时在elasticsearch.yml里面配置好拼音分词器的过滤器


3、同义词分词器配置:

  3.1、在elasticsearch.yml里面配置好同义词分词器的过滤器


  3.2、配置同义词词库,在elasticsearch的config目录下新建sysnonym.txt。

4、配置ik+pinying+同义词的分词器:

index:
  analysis:
    analyzer:
      ik:
        alias: [news_analyzer_ik,ik_analyzer]
        type: org.elasticsearch.index.analysis.IkAnalyzerProvider
      ik_analyzer_pinyin:
        type: custom
        tokenizer: ik
        filter: [synonym_test_filter,pinyin_mcl]
    filter:
      synonym_test_filter:
        type: synonym_filter
        synonyms_path: synonym.txt
        dynamic_reload: true
        reload_interval: 10s
        expand: true
      pinyin_mcl:
        type: pinyin
        first_letter: none
        padding_char: ""

分词器配置说明:

ik_analyzer_pinyin:                                //分词器的名称
        type: custom                               //类型:custom 表示自己定制
        tokenizer: ik                              //分割词元的组件:这里使用的是IK
        filter: [synonym_test_filter,pinyin_mcl]   //对分割的次元做处理:这里使用的是拼音和同义词

5、分词器使用:参考 《ElasticSearch 安装和使用IK分词器

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值