elasticsearch：近似匹配、短语匹配及优化——笔记

最新推荐文章于 2024-07-25 18:31:33 发布

星辰_mya

最新推荐文章于 2024-07-25 18:31:33 发布

阅读量4.9k

点赞数

分类专栏： ELK+Filebeat 文章标签： elasticsearch 搜索

本文链接：https://blog.csdn.net/ma15732625261/article/details/79512250

版权

本文介绍了Elasticsearch中的短语匹配（Phrase Match）和近似匹配（Proximity Match），包括slop的概念以及两者的区别。match查询性能优于phrase match，后者需要计算term位置。为优化性能，可以先使用match过滤数据，再用proximity match进行重计分（rescoring）以调整doc分数。

摘要由CSDN通过智能技术生成

短语匹配：

phrase match：多个term作为一个单位，作为搜索条件

GET /forum/article/_search
{
  "query": {
    "match_phrase": {
      "title":{ 
        "query": "java spark",
        "slop":3

      }
    }
  }
}

slop：term的移动次数，可反向移（内部机制吧）
关键词靠的越近打分越高——近似匹配proximity_match
召回率比较低，要求精确度

分词后的position

GET _analyze
{
  "text":"hello w

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

星辰_mya

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Elasticsearch学习（十三）前缀匹配、短语匹配

码易的博客

03-29

2453

目录前言一、创建索引二、前缀匹配三、短语匹配四、总结前言 prefix 前缀匹配对于一些特定的匹配是有效的，但使用方式还是应当注意。当字段中词的集合很小时，可以放心使用，但是它的伸缩性并不好，会对集群带来很大压力。前缀越短所需访问的词越多，可以使用较长的前缀来限制这种影响，减少需要访问的量。一、创建索引 1、实

ES（elasticsearch）搜索标题精准匹配度调节

xiaosky5566的博客

09-02

9675

/** * 搜索专辑 * @param string $keywords 搜索词 * @param int $offset 偏移量 * @param int $limit 每页数量 * @param array $sort 排序条件, 默认按相关性排序, 支持多组(见self::$sort_*) * @param int ...

2 条评论您还未登录，请先登录后发表或查看评论

ElasticSearch(六)— 全文检索

最新发布

敲代码的小小酥的博客

07-25

2305

前面讲到的query中的查询，都是精准查询。可以理解成跟在关系型数据库中的查询类似。match系列的查询，是全文检索的查询。会通过分词进行评分，匹配，再返回搜索结果。

Elasticsearch2.x 全文检索之——文档匹配度

weixin_34302561的博客

09-30

860

什么是文档匹配度？在ES中执行一个搜索请求在默认情况下搜索的结果集是按照匹配度倒序排列。但是什么是文档匹配度？它是如何被计算的呢？每个文档的匹配度评分在es中被表示为一个浮点型的正数——“_score”，文档的_score评分越高，文档与搜索词的匹配度越大。在查询中一个查询子句会为每一个文档生成一个_score，文档评分的计算依赖于具体查询子句的类型，不同的查询子句被用在不同的...

elasticsearch笔记_近似匹配_部分匹配

03-01

156

elasticsearch笔记_近似匹配_部分匹配转载于:https://my.oschina.net/u/3734816/blog/3016586...

ElasticSearch相似度匹配及分词器选择

chenxy02的博客

06-30

1万+

ES核心相似度匹配逻辑： ES的核心相似度匹配逻辑，或者匹配目的，可以不是很严谨的用以下两句话承载。局部常见：该单词在文档中多次出现全局罕见：该单词在语料库中出现的次数并不多。详见：https://blog.csdn.net/chenxy02/article/details/115377912 分词器选择： ES相似度匹配的结果与所选择的分词器类别息息相关，常见的分词器如下： Standard：单字切分法，一个字（对于英文为一个单词）切分成一个词，ES默认内置分词器。 CJKAnalyz

白日梦的Elasticsearch实战笔记，ES账号免费借用、32个查询案例、15个聚合案例、7个查询优化技巧。

qq_41973677的博客

01-24

1037

一、导读 Hi！大家久等了！时隔10天，白日梦的Elasticsearch笔记进阶篇终于甘完了！本次更新依然是干货满满！下面会和大家分享 32种查询方法、15中聚合方式、7种优化后的查询技巧。欢迎大家转发支持！如果对ES中的各种概念不太清楚可以去看上一篇文章，白日梦的ES笔记-基础篇，并且有些概念不理解并不会影响你看懂本文中为大家介绍的各种查询方式。下一篇(白日梦的ES系列笔记第三篇)文章会跟大家一起杀回到基础部分，系统的做一次概念上的扫盲！最后一篇（ES系列笔记第四篇）以编程语言实战为主，不出意

Elasticsearch学习笔记 - 09: _score(评分)

u011682283的博客

01-12

1386

Elasticsearch 默认是按照文档与查询的相关度(匹配度)的得分倒序返回结果的. 得分 (_score) 就越大, 表示相关性越高. 词频/逆向文档频率(TF/IDF) 当匹配到一组文档后，需要根据相关度排序这些文档，不是所有的文档都包含所有词，有些词比其他的词更重要。一个文档的相关度评分部分取决于每个查询词在文档中的权重。词的权重由三个因素决定词频词在文档中出现的频度...

elasticsearch源码解析笔记

qq_36059306的博客

07-08

3873

1.2.3 集群状态集群状态是全局信息，包括内容路由和配置信息，内容路由描述了哪个分片位于哪个节点主节点负责维护集群状态，从数据节点接收更新，将这些更新广播到集群的其他节点，让每个节点上的集群状态保持最新。ES2.0之后，更新的集群状态是增量的并且是压缩过的。 1.2.4 集群扩容当扩容集群，添加节点时，分片会均匀地分配到各个节点分片分配过程中除了让节点间分片分配均匀，还要保证主副分片不在同一节点，避免单个节点故障引起数据丢失疑问：副分片可以分配在同一个节点吗？？？？？？？当主节点出现异常，集群

ElasticSearch----分布式搜索引擎

liu_to_liu的博客

08-19

2500

ElasticSearchElasticSearchRESTfulLuceneElasticSearchElasticSearch安装单节点安装HEAD 插件安装浏览器插件安装下载插件安装分布式安装Kibana 安装ElasticSearch核心概念介绍ElasticSearch核心概念集群（Cluster）节点（Node）索引（Index）类型（Type）文档（Document）分片（Shards）副本（Replicas）SettingsMappingAnalyzerElasticSearch Vs 关系

ElasticSearch 学习10 短语匹配查询 match_phrase

zhaofuqiangmycomm的博客

02-19

2436

例如，如果查询是“quick brown fox”，match查询将匹配包含“quick”、“brown”或“fox”的文档，而不管它们的顺序如何。③ 如果想要 title 字段包含 ”文雅精品酒店“ 的文档也被查询到，则可以设置 match_phrase 查询的 slop 参数，它用来调节匹配词之间的距离阈值，默认为0，表示必须按照给定的顺序精确匹配。它会将查询字符串分解成单词，然后按照顺序匹配文档中的单词，只有当文档中的单词顺序与查询字符串中的单词顺序完全一致时才会匹配成功。

Elasticsearch(十四)搜索---搜索匹配功能⑤--全文搜索

学习不止境的博客

08-23

1283

不同于之前的term。terms等结构化查询，全文搜索首先对查询词进行分析，然后根据查询词的分词结果构建查询。这里所说的全文指的是文本类型数据（text类型）,默认的数据形式是人类的自然语言，如对话内容、图书名称、商品介绍和酒店名称等。结构化搜索关注的是数据是否匹配，全文搜索关注的是匹配程度；结构化搜索一般用于精确匹配，而全文搜索用于部分匹配。本章将详细介绍使用最多的全文搜索。

ElasticSearch 纯度和匹配度排序实现

Yuli_li的专栏

10-09

3170

wildcardQuery GaussDecayFunctionBuilder 高斯函数比对 EsQuery query = new EsQuery(); if(null==size){ query.setPager(0,10); }else{ query.setPager(0,size); } query.includes( "id","tradeName","prd","coverImgId","coverImgSrc","ecoStatus","base64Image..

laravel 分词搜索匹配度_elasticsearch基础笔记9-elasticsearch 词项&全文搜索

weixin_39611413的博客

11-30

381

es的核心功能就是搜索和分析。那么我们看看搜索相关内容1、搜索机制在进入搜索之前，会对查询体根据情况进行分析和处理。2、有哪些常用搜索类型全文查询词项查询复合查询嵌套查询位置查询特殊查询等。我们常用到的就是前三种，学起来简单，用起来特别难。3、看看这三种查询的区别。词项查询用来查找指定字段中，包含给定的单词的文档，词项查询不会被解析，只有查询词和文档中的词精确匹配才会被搜索到，常见的应用...

ElasticSearch近似匹配调研

qq_29579431的博客

01-03

260

一、载入数据 1.1 新建和删除索引在ElasticSearch中，索引的含义和关系型数据库中的数据库类似。如下命令可以查看当前节点下所有索引： curl -X GET 'http://localhost:9200/_cat/indices?v' 新建Index可以直接向Elastic服务器发出PUT请求。如下建立mysql_log索引： curl -X PUT 'localhost:9200/mysql_log' 删除索引使用DELETE请求，如下： curl -X DELETE 'localhos

Elasticsearch 全文匹配查询

taizhen/blog

09-02

2515

dis_max查询相比使用bool查询，我们可以使用dis_max查询(Disjuction Max Query)。Disjuction的意思"OR"(而Conjunction的意思是"AND")，因此Disjuction Max Query的意思就是返回匹配了任何查询的文档，并且分值是产生了最佳匹配的查询所对应的分值： { "query": { "d

elasticsearch基本查询三（英文分词）match查询