ElasticSearch学习笔记-同义词记录

人生偌只如初见

已于 2023-01-30 18:50:41 修改

阅读量2.2k

点赞数 1

分类专栏： ElasticSearch 文章标签： ElasticSearch Synonyms

于 2017-09-02 14:37:42 首次发布

本文链接：https://blog.csdn.net/fighting_one_piece/article/details/77800921

版权

本文介绍了ElasticSearch中实现同义词的三种方式，包括定义同义词过滤器、使用动态同义词插件以及通过JavaAPI进行关键词查询与同义词查询的关联。强调同义词应与原始文本的主字段配合使用，扩大匹配范围。

摘要由CSDN通过智能技术生成

同义词扩大了一个匹配文件的范围。正如词干提取或者部分匹配，同义词的字段不应该被单独使用，而应该与一个针对主字段的查询操作一起使用，这个主字段应该包含纯净格式的原始文本。

第一种实现方式：

同义词可以取代现有的语汇单元或通过使用同义词语汇单元过滤器，添加到语汇单元流中。首先，我们定义了一个同义词类型的语汇单元过滤器。然后我们创建了一个使用同义词类型的语汇单元过滤器的自定义分析器。

PUT http://localhost:9200/temp_index
{
  "settings": {
    "analysis": {
      "filter": {
        "my_synonym_filter": {
          "type": "synonym", 
          "expand": true,
          "ignore_case": true
          "synonyms_path" : "analysis/synonym.txt"
          "synonyms": [ 
            "british,english",
            "queen,monarch"
            "usa, america, united states => usa"
          ]
        }
      },
      "analyzer": {
        "my_synonyms": {
          "tokenizer": "ik_max_word",
          "filter": [
            "lowercase",
            "my_synonym_filter" 
          ]
        }
      }
    }
  }
}

同义词一般格式：

简单扩展：我们可以把同义词列表中的任意一个词扩展成同义词列表所有的词。

举例 "jump,hop,leap"

简单收缩：把左边的多个同义词映射到了右边的单个词。它必须同时应用于索引和查询阶段，以确保查询词项映射到索引中存在的同一个值。

举例 "leap,hop => jump"

最低0.47元/天解锁文章

人生偌只如初见

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
4
评论
ElasticSearch学习笔记-同义词记录

同义词扩大了一个匹配文件的范围。正如词干提取或者部分匹配，同义词的字段不应该被单独使用，而应该与一个针对主字段的查询操作一起使用，这个主字段应该包含纯净格式的原始文本。第一种实现方式：同义词可以取代现有的语汇单元或通过使用同义词语汇单元过滤器，添加到语汇单元流中。首先，我们定义了一个同义词类型的语汇单元过滤器。然后我们创建了一个使用同义词类型的语汇单元过滤器的自定义分析器。PUT
复制链接

扫一扫

专栏目录