ES Data Pipeline

本文介绍了在将数据写入 Elasticsearch (ES) 时如何实现个性化定制和数据清洗,即所谓的 'ES Data Pipeline'。主要内容包括更新方式(如 update、update by query 和 reindex)、API 概览(如 Update API 和 Update By Query API)以及使用 Painless Script 和 Ingest Processors 创建 Pipeline 的经验分享。
摘要由CSDN通过智能技术生成

在我们将数据写入ES时候需要做一些个性化的定制、数据清洗等需求,我在这里统称为“ES Data Pipeline”。比如:我们需要在添加每条数据的同时,增加时间戳这个字段添加系统时间;修改某个字段的名称;对于某个字段值进行一些加加减减等等。如何满足这些需求呢,我觉得市面上的一些总结都很乱,在此梳理下脉络结构。

更新方式
  • update、update by query
    在原有索引文档的基础上进行更新。
  • reindex
    另建索引,将原始索引的数据通过各种手段进行修改写入新的索引。
API总览
  • Update API
    对于文档进行部分(指定id)或者全量更新,一般结合脚本使用。
    例子:
POST hamlet-raw/_update/1
{
   "script" : {
       "source": "ctx._source.add_some_shit= '3.1.64'",
       "lang": "painless"
   }
}
  • Update By Query API
    可以根据Query语句进行条件更新。
    例子:
PUT _ingest/pipeline/add_speaker
{
  "processors": [
    {
      "set": {
        "field": "speaker",
        "value": &
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值