flume系列之:拦截器和自定义flume拦截器

537 篇文章 548 订阅 ¥49.90 ¥99.00
103 篇文章 146 订阅 ¥19.90 ¥99.00
67 篇文章 18 订阅 ¥29.90 ¥99.00
本文介绍了Flume的Event数据结构,深入解析了拦截器的工作原理,并详细阐述了如何自定义拦截器,包括实现`intercept(Event event)`和`intercept(List<Event>)`方法,用于在Event中添加数据生成时间。此外,还分享了自定义拦截器的pom.xml配置及flume.conf配置文件中的设置方法。
摘要由CSDN通过智能技术生成


Flume中的拦截器(interceptor),用户Source读取events发送到Sink的时候,在Event header中加入一些有用的信息,或者对Event的内容进行过滤,完成初步的数据清洗。这在实际业务场景中非常有用,例如通过拦截器可以把数据库名称、表名、Event生成的时间放入Event的header中,用于生成hdfs的文件存放目录。

如下所示是文件sink到hdfs的目录:其中optics_prod是数据库名称,sale_order是表名,这些都是通过flume拦截器获取到的。

/raw/optics_prod/sale_order/1h/20210805/04/bigdata1-flumedata.1628136015077.gz

一、flume的Event数据结构

一行文本内容被反序列化成一个Event。flume中的Event最大定义为2048字节,超过2048字节则会切割放到下一个Event中,默认编码是UTF-8。

查看下Event定义的数据结构

public interface Event
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

快乐骑行^_^

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值