Logstash指定部分output的document_id

最新推荐文章于 2023-07-30 07:26:17 发布

为早日退休而奋斗

最新推荐文章于 2023-07-30 07:26:17 发布

阅读量4.2k

点赞数

分类专栏： ELK 文章标签： elasticsearch es filter

本文链接：https://blog.csdn.net/weixin_42119008/article/details/108533741

版权

ELK 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

需求

有两个Filebeat进行日志采集，通过同一个logstash输出至ElasticSearch，其中一个采集器a中需要指定一个字段key_id为document_id，以确保以此字段进行重复过滤，另一个采集器b使用默认生成的document_id。

logstash配置

input {
    beats {
        port => 5044
        host => "0.0.0.0"
        ssl => false
    }
}

filter{
    if [fields][app_name] == "a"{
        grok {
            patterns_dir => ["/opt/logstash/patterns"]
            match => {
                "message" => "..."
            }
            overwrite => [ "message" ]
        }
        date {
            match => [
                "[time][log]", "ISO8601"
            ]
        }
        prune {
            whitelist_names => [ "@timestamp", "key_id"...]//保留字段中含有key_id
        }
    }
    if [fields][app_name] == "b"{
        grok {
            patterns_dir => ["/opt/logstash/patterns"]
            match => {
                "message" => "(?<message>.*)"
            }
            overwrite => [ "message" ]
        }
        date {
            match => [
                "[time][log]", "ISO8601"
            ]
        }
        prune {
            whitelist_names => [ "@timestamp", "message"]//保留字段中无key_id
        }
    }
}

output{
    if [key_id] {//若含有key_id的字段，对此字段进行转换为document_id，以确保对此字段的唯一性进行重复消息覆盖
        elasticsearch{
            hosts=>["es01:9200"]
            manage_template => false
            index => "%{[fields][app_name]}"
            document_type => "%{[@metadata][type]}"
            document_id => "%{key_id}"
        }
    } else {//一般不含key_id的输出不对document_id进行转换
        elasticsearch{
            hosts=>["es01:9200"]
            manage_template => false
            index => "%{[fields][app_name]}"
            document_type => "%{[@metadata][type]}"
        }
    }
}

为早日退休而奋斗

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Logstash指定部分output的document_id

需求有两个Filebeat进行日志采集，通过同一个logstash输出至ElasticSearch，其中一个采集器a中需要指定一个字段key_id为document_id，以确保以此字段进行重复过滤，另一个采集器b使用默认生成的document_id。logstash配置input { beats { port => 5044 host => "0.0.0.0" ssl => false }}filter{
复制链接

扫一扫

专栏目录