elastic课程知识扩展 | Ingest Pipeline

Ingest Node

ElasticSearch 5.0 后,引入的一种新的节点类型,默认配置下,每个节点都是 Ingest Node;Ingest Node 具有预处理数据的能力,可拦截 Index,对数据进行预处理
例如:

  • 为某个字段设置默认值;
  • 重命名某个字段的字段名;
  • 对字段值进行 Split 操作;
  • 支持设置 Painless Script,对数据进行更加复杂的加工

Pipeline定义

Pipeline是一系列处理器的定义,这些处理器将按照声明的顺序执行。管道包含两个主要字段:description 和processors

  • description:用于存储有关管道功能的有用描述。
  • processors:参数定义了要按顺序执行的处理器列表。
pipeline基本常用语法

定义字段 foo 字段值为 bar

PUT _ingest/pipeline/my-pipeline
{
  "description" : "describe pipeline",
  "processors" : [
    {
      "set" : {
        "field": "foo",
        "value": "bar"
      }
    }
  ]

将源字段message重命名为msg

      "rename" : {
        "field": "message",
        "target_field": "msg"
      }

将源字段message转换为json格式,放入目标字段data

      "json" : {
        "field": "message",
        "target_field": "data"
      }

@timestamp日期格式化

	"date" : {
		"field" :"@timestamp",
		"formats":[
			"ISO8601"
		],
		"ignore_failure":false,
		"timezone": "Asia/Shanghai"
	}

同时支持判断 引入其他pipeline,当数据满足字段data为2时,会走my-pipeline-2

      "pipeline" : {
        "name": "my-pipeline-2",
        "if": "ctx.data='2' "
      }
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Elasticsearch 中,Ingest Pipelines 是一种机制,可用于在将文档索引到 Elasticsearch 之前对它们进行处理。这些处理可以包括数据转换、文本解析、数据验证等。Ingest Pipelines 通常用于数据预处理,以便更有效地索引数据,提高搜索性能。 以下是创建 Ingest Pipelines 的步骤: 1. 定义 Pipeline:使用 ElasticsearchIngest API 定义 Pipeline。您可以使用 PUT 请求来定义 Pipeline,指定 Pipeline 的名称和包含处理步骤的 JSON 配置。 例如,以下是一个简单的 Pipeline,它将从文档中提取 "message" 字段,并将其添加到 "myfield" 字段中: ``` PUT _ingest/pipeline/my-pipeline { "description": "My pipeline", "processors": [ { "set": { "field": "myfield", "value": "{{message}}" } } ] } ``` 2. 测试 Pipeline:使用 Elasticsearch 的 simulate API 测试 Pipeline。您可以使用 POST 请求来测试 Pipeline,指定 Pipeline 的名称和要处理的文档。 例如,以下是一个简单的测试请求,它将使用 "my-pipeline" Pipeline 处理一个包含 "message" 字段的文档: ``` POST _ingest/pipeline/my-pipeline/_simulate { "docs": [ { "_source": { "message": "Hello, World!" } } ] } ``` 3. 应用 Pipeline:将 Pipeline 应用于文档。在索引文档时,您可以使用 "pipeline" 参数指定要使用的 Pipeline。 例如,以下是一个简单的索引请求,它将使用 "my-pipeline" Pipeline 处理一个包含 "message" 字段的文档: ``` PUT my-index/_doc/1?pipeline=my-pipeline { "message": "Hello, World!" } ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值