Flink自定义metric监控流入量

最新推荐文章于 2024-08-23 10:13:09 发布

pucheung

最新推荐文章于 2024-08-23 10:13:09 发布

阅读量4.6k

点赞数 1

分类专栏： Flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013516966/article/details/102927827

版权

本文介绍了如何在Flink任务中自定义监控指标，特别是针对数据源（如Kafka）的流入数据进行正常数据与脏数据的统计。通过创建自定义的`AbstractDeserializationSchema`子类并集成`Counter`类型的Metric，实现了在数据反序列化时同步进行统计。通过将`RuntimeContext`传递给自定义消费者，可以在Flink的Web UI中观察到normalDataNum和dirtyDataNum的监控指标。

摘要由CSDN通过智能技术生成

点击蓝字

640?wx_fmt=png

关注~~

flink任务本身提供了各种类型的指标监控，细化到了每一个Operator的流入/流出量、速率、Watermark值等，通常在实际应用中需要对接入数据做格式化例如转json，符合要求的数据会向下流动，不符合要求或者格式化异常称为脏数据会被过滤掉，现在目标实现一个通用化方式能够对正常数据与脏数据进行指标统计。

flink metric类型分为Counter、Gauge、Histogram、Meter，需要统计的是一个累加值因此选取Counter类型的metirc
由于是对任务的流入监控，因此需要在Source端进行处理，通常对接的数据源是kafka, 而flink本身已经提供了kakfa connector，并且开放了数据反序列化的接口DeserializationSchema与抽象类AbstractDeserializationSchema，实现该接口或者继承抽象类可以完成数据的反序列化与格式化，由于每一条数据都需要进过反序列化处理，那么可以在反序列化的同时进行指标统计
在flink中自定义Metric入口是Runt

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。