flink实战--延迟监控 metrics.latency.interval

本文详细介绍了Flink流处理中如何进行数据延迟监控,特别是metrics.latency.interval配置的作用。通过LatencyMarks和LatencyMarker,Flink能够跟踪数据延迟,并提供不同粒度的延迟统计。在启用延迟跟踪后,用户可以在Flink UI的Metrics中查看延迟信息。建议适当设置metrics.latency.interval的值以避免过度消耗资源。
摘要由CSDN通过智能技术生成

背景

             流处理系统进行数据计算时,数据延迟是不可接受的,但是又不可避免的。出现数据延迟我们需要知道任务延迟的整体分布(哪些算子数据流转出现了延迟)。因此延迟监控在流处理框架中极其重要。Flink作为流处理框架的翘楚,在数据延迟方面也有系统性的方案,本文详细介绍DataStream以及FlinkSQL如何对数据延迟进行监控。

LatencyMarks

              与通过水印来标记事件时间的推进进度相似,Flink也用一种特殊的流元素作为延迟的标记,称为LatencyMarker。LatencyMarker在source上以可配置发送间隔,并由任务Task转发。Sink最后接收到LatencyMarks后,将比较LatencyMarker的时间戳与当前系统时间,以确定延迟。LatencyMarker不会增加作业的延迟,但是LatencyMarker与常规记录类似,可以被delay阻塞(例如反压情况),因此LatencyMarker的延迟与Record延迟近似。

 metrics.latency.interval 与metrics.latency.granularity

          默认情况下Flink是禁用延迟跟踪。要启用延迟跟踪,您必须在ExecutionConfig中将latencyTrackingInterval在Flink设置

flink-shaded-hadoop-3-uber.jar是一个用于Flink的Hadoop 3.x Uber JAR包。Hadoop是一个用于处理大规模数据的开源分布式计算框架,而Flink则是另一个用于流处理和批处理的分布式计算框架。 Hadoop 3.x是Hadoop的最新版本,相比于之前的版本,它引入了许多新的功能和改进。flink-shaded-hadoop-3-uber.jar被用来解决Flink与Hadoop 3.x版本之间的兼容性问题。它包含了Flink所需的Hadoop 3.x依赖的库文件和代码,并将它们以Uber JAR的形式打包在一起。 Uber JAR是将一个应用程序和其所有依赖打包为一个独立的JAR文件的方法。flink-shaded-hadoop-3-uber.jar是一个包含了Flink与Hadoop 3.x兼容性所需的所有库文件和代码的Uber JAR文件。这样,当我们在使用Flink与Hadoop 3.x进行分布式计算时,只需要将这个Uber JAR文件添加到我们的Flink应用程序中,就可以正常运行。 通过使用flink-shaded-hadoop-3-uber.jar,Flink能够利用Hadoop 3.x的新功能和改进,例如支持更高的数据可靠性、更高的性能和更好的容错性。此外,由于所有必需的库文件和代码都被打包在一起,我们可以简化配置和部署过程,减少潜在的兼容性问题。 总之,flink-shaded-hadoop-3-uber.jar是一个用于解决Flink与Hadoop 3.x兼容性问题的Uber JAR文件,它包含了Flink所需的Hadoop 3.x依赖的所有库文件和代码,能够让我们更方便地使用Flink与Hadoop 3.x进行分布式计算。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

阿华田512

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值