flume系列之:拦截器过滤数据
一、kafka空值数据
ConsumerRecord(topic=‘debezium-prod-optics_prod_1h.optics_prod.user_order’, partition=2, offset=3636705, timestamp=1656746091521, timestamp_type=0, key=b’{“schema”:{“type”:“struct”,“fields”:[{“type”:“int32”,“optional”:false,“field”:“order_id”}],“optional”:false,“name”:“debezium_prod_optics_prod_1h.order_prod.user_order.Key”},“playload”:{“order_id”:2752094}}', value=None, headers=[], checksum=None, serialized_key_size=223, serialized_value_size=-1, serialized_header_size=-1)
如上所示:
- value=None
- flume可以使用拦截器过滤掉value为None的kafka消息
二、拦截器过滤空值数据
更多拦截器相关博客请参考博主下面两篇文章:
本文介绍了如何使用Flume拦截器处理Kafka中的空值数据。针对Kafka ConsumerRecord中value为None的情况,通过Flume拦截器进行过滤。文章还提到了相关拦截器开发的博客资源,以帮助读者更深入理解拦截器的工作原理和使用。
订阅专栏 解锁全文
644

被折叠的 条评论
为什么被折叠?



