关于Flink中time与watermark的理解

本文介绍了Flink中的时间属性,包括Processing Time和Event Time,并重点解析了Event Time下的watermark概念,用于处理时间乱序问题。watermark作为处理数据迟到的一种策略,确保了窗口聚合结果的有效性。此外,还提到了Flink提供的不同窗口类型以及如何应对数据迟到的处理方式。
摘要由CSDN通过智能技术生成

关于Flink中time与watermark的理解

空间和时间只是我们人类思考的模式,并不是我们赖以生存的条件。
——爱因斯坦

时间属性是流处理中最重要的一个方面,是流处理系统的基石之一;流计算是一种无限数据形式,如果没有时间属性,许多问题将不能解决,下面将列举和时间列紧密相关,或者说必须在这个时间列上才能进行的操作:
Over 窗口聚合
Group by 窗口聚合
OrderBy 排序
时间概念:
在flink中,时间的核心是 Processing Time 和 Event Time(Row Time);Processing Time,即事件被处理的时间。处理时间其实就是处理事件的机器所测量的时间;事件时间,即事件实际发生的时间。更准确地说,每一个事件都有一个与它相关的时间戳,并且时间戳是数据记录的一部分(比如手机或者服务器的记录)。事件时间其实就是时间戳。
两者的概念中我觉得以下的解释相当好:
在这里插入图片描述
时间是人为的一种规定,一天24小时,是地球自传一周,一年是地球饶太阳一周,时间是一种运动;Processing Time是现在正在出现,发生的时间,是真实世界中时间;Event Time时间,是某个世界的时间,就像精灵宝可梦中,小智

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值