Elasticsearch使用Ingest Pipeline进行数据预处理

最新推荐文章于 2025-08-21 00:43:16 发布

原创

最新推荐文章于 2025-08-21 00:43:16 发布 · 3.8k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#elasticsearch #数据预处理 #ES进行数据预处理

本文详细介绍了Elasticsearch 7.x如何使用Ingest Pipeline进行数据预处理，替代Logstash。内容涵盖Ingest Pipeline的基本概念、常用processor及其用法，包括split、join、gsub等，并通过实例展示了如何创建和应用pipeline，以及使用Painless脚本处理复杂场景。同时，对比了Ingest Pipeline与Logstash在数据预处理上的异同。

本文基于Elasticsearch7.x

Elasticsearch可以使用自身的Ingest Pipeline功能进行数据预处理, 无须借助Logstash.

Ingest Pipeline介绍

在这里插入图片描述

Ingest Pipeline 就是在文档写入Data Node之前进行一系列的数据预处理, 进行数据预处理的就是processor, 一组处理器构成了Pipeline. 所有的预处理都在Ingest Node上执行, 默认情况下所有节点都是Ingest Node.

常用的processor

split processor
字符串切分成数组
join processor
数组转化成字符串
gsub processor
字符串替换
set processor
创建或替换一个字段.
remove processor
移除一个字段
rename processor
重命名一个字段
lowercase processor
字符串小写化
upcase processor
字符串大写化
script processor
使用painless脚本进行复杂的处理
…

语法

(1) 创建pipeline

description是对pipeline的描述, processors定义了一组处理器.

PUT /_ingest/pipeline/my

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。