Elasticsearch 对Text类型进行聚合

最新推荐文章于 2023-08-17 20:17:27 发布

心丨悦_蜗牛在裸奔

最新推荐文章于 2023-08-17 20:17:27 发布

阅读量5k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： Elasticsearch 全文检索-6.0.0 文章标签： Elasticsearch text聚合

本文链接：https://blog.csdn.net/qinyuezhan/article/details/79164490

Elasticsearch 全文检索-6.0.0 专栏收录该内容

14 篇文章

订阅专栏

本文介绍如何在Elasticsearch中设置mapping时开启fielddata功能，以便支持高效的聚合和排序操作。通过一个具体例子展示了如何指定字段类型并启用fielddata。

设置mapping的时候需要设置fielddata 为true

PUT my_index/_mapping/my_type

{

  "properties": {

    "my_field": { 

      "type":     "text",

      "fielddata": true

    }

  }

}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

心丨悦_蜗牛在裸奔

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

java文本检索pdf,ElasticSearch7.X解析/存储/检索word、pdf文档

weixin_34835735的博客

03-11

918

es 5.x以后提供Ingest-Attachment插件管道(Pipeline)，可以解析上百种的office文件，将文档内容存储到es中。其解析能力配合es原有的全文检索能力配合上分词插件，是我们处理文档类型内容的一大利器。Linux安装Ingest-Attachment插件安装插件进入到es安装目录下的bin目录执行./elasticsearch-plugin install ingest-...

Elasticsearch（text和keyword）区别分析

最新发布

qq_33416416的博客

09-03

384

当keyword类型字段的index属性设置为false时，表示该字段不会被构建倒排索引‌。总结就是keyword加上index=false就是这个字段只能读取，不能搜索。这种字段仅用于存储原始值，不会参与搜索、排序或聚合操作‌。keyword：精确匹配类型，适用于聚合、排序和过滤‌。text：全文检索类型，经过分词处理，支持模糊匹配‌。text比较常用，主要是分词查询等等。

1 条评论您还未登录，请先登录后发表或查看评论

elasticsearch text类型聚合操作

ASN_forever的博客

12-26

6457

基础：es版本6.0 text类型时分析型类型，默认是不允许进行聚合操作的。如果想对text类型的域（就是字段、属性的意思）进行聚合操作，需要设置其fielddata为true。但这样设置完了只是满足聚合要求了，而无法满足精准聚合，就是说text类型还是会进行分词分析过程，导致针对一个text类型的域进行聚合的时候，可能会不准确。因此还需要设置此字段的fileds子域为keyword类型，经过这...

记一次最全的Java+Elasticsearch数据保存与查询操作

Java_Long_Asus的博客

12-09

1万+

前言最近公司有一个需求，就是要将网关（Java开发）的日志写入Elasticsearch中，并进行日志查询与展示，由于楼主之前没有接触过Elasticsearch,更谈不上Java Api的使用了，于是苦思良久，各种查阅资料，最后功夫不负有心人，终于完成了功能。现将过程及方法论分享如下，希望可以帮到他人。一、相关Jar包的引入 Java使用Elasticsearc...

Elasticsearch (ES) 搜索引擎: 数据类型、动态映射、多类型（子字段）

谢TS的博客

08-17

2390

ES 映射字段的数据类型。keyword 类型是不可切分的字符串类型，需要全匹配，用于字符串是否相等的比较。keyword 类型一般用于文档的过滤、排序和聚合。在实际场景用，keyword 一般用于描述用户名、类型、用户ID、URL 等。text 类型是可进行分词分隔的字符串类型，支持部分匹配、模糊匹配。由于 text 是模糊匹配，所有支持匹配度打分。text 类型一般用于描述文章标题、文章内容等。数值类型支持相等、范围（大小）比较，也可用于对文档的过滤、排序和聚合。

解决Elasticsearch的Text类型的字段参与聚合和排序

后端开发

10-22

2687

text字段类型用于全文内容，例如电子邮件正文或产品说明，并且es会通过分析器对字符串进行分词，可以在全文检索中搜索单独的单词。文本字段最适合非结构化但可读的内容并且不用于排序，也很少用于聚合keyword主要用于结构化内容的字段，并且总是会有相同值的字段。因为通常需要用于聚合、排序和术语级查询(如term)，所以避免参与全文检索如果需要使用text字段类型进行聚合和排序，则需要在建立mapping映射时在fields字段中增加一个keyword类型的数据。

Elasticsearch：计数分词中的 token

Elastic 中国社区官方博客

01-31

602

查询来检索 book_name 中包含 3 个以上 token 的文档，我们只会得到标题为 “One Hundred Years of Solitude” 的文档。在我们针对 text 类型的字段进行分词时，分词器会把该字段分解为一个个的 token。我们下面用一个比较简单的例子来进行展示。在我们的示例中，我们将索引一些书名，并且我们将过滤标题中只有 2 个 token 的书。该类型是 token 的计数器，也就是说，我们可以使用它来了解在索引字段时在字符串中生成的 token 数量。

【大数据实战】将普通文本文件导入ElasticSearch

weixin_30606461的博客

03-08

3504

以《刑法》文本.txt为例。一、格式化数据 1，首先，ElasticSearch只能接收格式化的数据，所以，我们需要将文本文件转换为格式化的数据---json。下图为未处理的文本文件。 2，这里，使用python文件操作，将文本格式化为ElasticSearch可识别的json格式。 #python 3.6 #!/usr/bin...

springboot+Elasticsearch实现word，pdf，txt内容抽取并高亮分词全文检索

热门推荐

weixin_43998777的博客

08-11

14万+

Java集成es实现对文本类型附件的内容抽取并实现高亮显示分词，全文检索内容

ElasticSearch 6.2 Mapping参数说明及text类型字段聚合查询配置

m0_57302315的博客

11-02

901

特别提示：　　　　1，建议大家创建索引的时候指定mapping(用到特定分词器，规划字段是否被索引来节省空间等) 　　　　2，mapping创建并插入数据后就无法进行更改了！所以要对需求考虑全面：例如对于text类型字段需要聚合查询(类似group by)对数据进行统计分析，　　就需要设置fielddata为true 和fields字段才能进行聚合操作(此处详解请看下面的内容2) 　　　　3，如果必须更改字段属性只能进行reindex，进行重新建立索引再将doc导入 ...

ES 21 - 通过 Elasticsearch 实现聚合检索 (分组统计)

xiangjai的专栏

10-17

7592

目录 1 普通聚合分析 1.1 直接聚合统计 1.2 先检索, 再聚合 1.3 扩展: fielddata和keyword的聚合比较 2 嵌套聚合 2.1 先分组, 再聚合统计 2.2 先分组, 再统计, 最后排序 2.3 先分组, 组内再分组, 然后统计、排序 1 普通聚合分析 1.1 直接聚合统计 (1) 计算每个tag下的文档数量, 请求语法: GET book_shop/it_book/_search { "size": 0, // 不显示命..

ElasticSearch学习笔记十五（桶聚合）

怡宝的大方哥

02-21

444

与关系型数据库一样，ElasticSearch 也有自己的聚合分析功能，对查询返回的结果进行处理，主要分为三大类：指标聚合、桶聚合、管道聚合。这一篇主要讲 ElasticSearch 的桶聚合功能。

[ElasticSearch]数据类型keyword和text的区别

Lionel的博客

10-27

3万+

ElasticSearch数据类型keyword和text的区别在 ES2.x 版本字符串数据是没有 keyword 和 text 类型的，只有string类型，ES更新到5版本后，取消了 string 数据类型，代替它的是 keyword 和 text 数据类型，那么 keyword 和 text 有什么区别了？ Text 数据类型被用来索引长文本，比如说电子邮件的主体部分或者一款产品的介绍。

elastic search text类型字段不支持聚合查询，及解决方案

Mrerlou的博客

04-26

3815

问题现象在对es的数据做聚合操作时，报错。报错语句： curl -XPOST http://10.11.3.63:9200/hadoop_impala_2021-04/_search -d ' { "aggs": { "qyeryTypes": { "cardinality": { "field": "queryType" } } } }' 报错内容 { "error": { "root_cause": [{ "type":

elasticsearch text字段排序报错解决

archer的技术故事

03-17

2万+

elasticsearch text字段排序报错解决使用elasticsearch 进行排序的时候，我们一般都会排序数字、日期。但是在排序text类型的时候就会出现错误。 GET xytest/sutdent/_search { "sort":[ {"region": {"order": "asc"}} ] , "from": 0 , "s

ElasticSearch中text和keyword类型的区别

ZK教皇的博客

05-15

2万+

在ES的2.X版本中，对于字符类型的数据，我们都使用string类型作为映射，然后再设置它的分词，例如我们新建了一个名为 zk_test的索引，类型为 info，为其中字符类型的name字段设置索引，设置不分词，Kibanan中操作如下PUT /zk_test/info/_mapping { "info":{ "properties":{ "name":{"typ...

ES 聚合分类（text字段）语句报错

记录一下

09-11

1416

{ "query": { "bool": { "must": { "term": { "type.keyword": "test" } } } }, "from": 0, "size": 0, "sort": [ { "msg_time": { ...

ElasticSearch超强聚合查询(一)

ydw的博客

03-08

3万+

Elasticsearch聚合查询一作者:ydw 地点:武汉联系方式:hyl9900208@163.com Elasticsearch聚合查询一聚合与搜索的概念高阶概念举例说明—关于汽车数据的相关聚合(Index=cars;type=transactions) 注意点:官方文档说明,如何设置fildData. 实战之—-查询那个颜色的汽车销量最好? ...

Elasticsearch5.X进行聚合操作时提示Fielddata is disabled on text fields by default

东境物语

11-09

2万+

Elasticsearch5.X聚合操作异常：Fielddata is disabled on text fields by default. Set fielddata=true on [color] in order to load fielddata in memory by uninverting the inverted index. Note that this can how

java +elasticsearch7对terms聚合实现分区

07-01