Flink窗口与watermark

Flink时间语义

事件事件 Event Time
处理时间 Process Time
进入时间 Ingestion Time

Watermark主要作用,及触发机制

Watermark是一种很亮Event Time进展的机制,用于处理乱序事件,单调递增的时间戳,数据流中的Wtermark用于表示timestamp小于Watermark的数据,都已经到达;
watermark(水位线,包含延迟) > 窗口结束时间

消息超过watermark的时间会丢失数据?

allowedLateness也是Flink处理原序事件的一个特别重要的特性,默认情况下,当wartermark通过window后,再进来的数据,也就是迟到或者晚到的数据就会被丢弃掉了,但是有时候我们希望在一个可以接受的范围内,迟到的数据,页可以被处理或者计算,这就是allowedLateness产生的原因
迟到的元素也可以使用侧输出(side output)特性被重定向到另外的一条流中,迟到的元素所组成的侧输出流可以继续处理或者sink到持久化

没有数据流的时候,窗口不会产生

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值