ES同义词

配置mapping

PUT /megacorp
{
  "mappings": {
      "properties": {
        "name":{
          "type": "text",
          "analyzer": "ik-index"
        }
    }
  },
  "settings": {
    "analysis": {
      "filter": {
        "local_synonym" : {
            "type" : "synonym",
            "synonyms_path" : "synonyms/synonyms.txt"  
        }
      },
      "analyzer": {
        "ik-index": {
          "type": "custom",
          "tokenizer": "ik_max_word",
          "filter": [
              "local_synonym"   
           ]
        }
      }
    }
  }
}

可以用以下命令查看,同义词是否配置成功


GET /megacorp/_analyze
{
  "analyzer": "ik-index",
  "text": "西红柿"
}

添加数据

PUT megacorp/_bulk
{"index":{"_id":"1"}}
{"name":"西红柿"}
{"index":{"_id":"2"}}
{"name":"番茄"}
{"index":{"_id":"3"}}
{"name":"圣女"}

查询西红柿

GET megacorp/_search
{
  "query": {
    "match": {
      "name": "西红柿"
    }
  }
}

结果

{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 3,
      "relation" : "eq"
    },
    "max_score" : 0.24480756,
    "hits" : [
      {
        "_index" : "megacorp",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.24480756,
        "_source" : {
          "name" : "西红柿"
        }
      },
      {
        "_index" : "megacorp",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 0.24480756,
        "_source" : {
          "name" : "番茄"
        }
      },
      {
        "_index" : "megacorp",
        "_type" : "_doc",
        "_id" : "3",
        "_score" : 0.24480756,
        "_source" : {
          "name" : "圣女"
        }
      }
    ]
  }
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Elasticsearch 的同义词过滤器实际上是一个基于词典的映射表,将同义词映射为一个或多个主词。在分析文本时,Elasticsearch 将会根据同义词过滤器中的词典,自动将同义词替换为对应的主词。 具体来说,当一个文本被索引到 Elasticsearch 中时,Elasticsearch 会先将文本分词,然后对每个词进行分析。在分析过程中,如果遇到一个同义词,Elasticsearch 就会将其替换为对应的主词,然后继续进行分析。这样,同义词就能够被视为相同的词汇,从而实现同义词检索。 同义词过滤器的实现依赖于 Elasticsearch 的分析器。分析器由一系列分词器和过滤器组成,其中分词器将文本分割成单词,而过滤器则对单词进行处理。同义词过滤器就是一种特殊的过滤器,它会在分析过程中,对单词进行同义词替换。 同义词过滤器的词典可以是一个文本文件,也可以是一个 Elasticsearch 索引。如果使用文本文件,可以在词典中指定同义词,每行一个同义词,用空格或逗号分隔。如果使用 Elasticsearch 索引,可以通过查询 API 动态获取同义词,从而实现动态的同义词检索。 总之,Elasticsearch 的同义词过滤器实现了同义词检索的功能,通过自动将同义词转换为主词,实现了对同义词的处理和索引。这使得 Elasticsearch 能够更加准确地匹配用户的查询,并返回更加精确的搜索结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值