Flink - 窗口

窗口(Window)就是将无限流切割为有限流的一种方式,

它会将流数据分发到有限大小的桶(bucket)中进行分析

时间窗口(Time Window)

  • 滚动时间窗口

将数据依据固定的窗口长度对数据进行切分

时间对齐,窗口长度固定,没有重叠

  • 滑动时间窗口
  • 会话窗口(只有Flink 支持)

计数窗口(Count Window)

  • 滚动计数窗口
  • 滑动计数窗口

窗口分配器——window() 方法

处理时间窗口

window(TumblingProcessingTimeWindows.of(Time.seconds(5)))

事件时间窗口

window(TumblingEventTimeWindows.of(Time.seconds(5)))

窗口聚合函数定义了要对窗口中收集的数据做的计算操作

可以分为两类

  • 增量聚合函数(不可以访问窗口信息)

每条数据到来就进行计算,只保存一个简单的状态(累加器)

ReduceFunction, AggregateFunction

当窗口闭合的时候,增量聚合完成

处理时间:当机器时间超过窗口结束时间的时候,窗口闭合

  • 全窗口聚合函数

先把窗口所有数据收集起来,等到计算的时候会遍历所有数据

ProcessWindowFunction

增量聚合和全窗口聚合结合使用

  • 可以访问窗口信息
  • 不需要收集窗口中的所有元素,只需要维护一个累加器,节省内存

其他参数解释:

  • trigger() ——触发器
  • 定义窗口什么时候关闭,触发计算并输出结果
  • .evictor() ——移除器
  • 定义移除某些数据的逻辑
  • .allowedLateness() ——允许处理迟到的数据
  • .sideOutputLateData() ——将迟到的数据放入侧输出流
  • .getSideOutput() ——获取侧输出流

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

javafanwk

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值