flink入门-03-Flink window API

本文深入探讨了Apache Flink中窗口的概念,包括时间窗口、滚动窗口、滑动窗口和会话窗口,并介绍了如何通过API进行窗口操作,如定义窗口、触发器、移除器以及处理迟到数据。此外,还阐述了窗口函数的不同类型,如增量聚合和全窗口函数,帮助理解流数据处理的细节。
摘要由CSDN通过智能技术生成

1、window 概念

1.1 窗口(window)

 

• 一般真实的流都是无界的,怎样处理无界的数据?

• 可以把无限的数据流进行切分,得到有限的数据集进行处理 —— 也就是得到有界流

• 窗口(window)就是将无限流切割为有限流的一种方式,它会将流 数据分发到有限大小的桶(bucket)中进行分析

2、window 类型

2.1 时间窗口(Time Window)

➢ 滚动时间窗口

➢ 滑动时间窗口

➢ 会话窗口

2.1.1 滚动窗口(Tumbling Windows)

 

• 将数据依据固定的窗口长度对数据进行切分

• 时间对齐,窗口长度固定,没有重叠

2.1.2 滑动窗口(Sliding Windows)

 

• 滑动窗口是固定窗口的更广义的一种形式,滑动窗口由固定的窗口长度和滑动间隔组成

• 窗口长度固定,可以有重叠

2.1.2 会话窗口(Session Windows)

 

• 一系列事件组合一个指定时间长度的 timeout 间隙组成,也就 是一段时间没有接收到新数据就会生成新的窗口

• 特点:时间无对齐

2.2 计数窗口(Count Window)

➢ 滚动计数窗口

详看3.2API实操

➢ 滑动计数窗口

详看3.2API实操

3、 window API

3.1 window API

• 窗口分配器 —— window() 方法

➢ 我们可以用 .window() 来定义一个窗口,然后基于这个 window 去做一些聚 合或者其它处理操作。注意 window () 方法必须在 keyBy 之后才能用。

➢ Flink 提供了更加简单的 .timeWindow 和 .countWindow 方法,用于定义 时间窗口和计数窗口。

• window() 方法接收的输入参数是一个 WindowAssigner

• WindowAssigner 负责将每条输入的数据分发到正确的 window 中

• Flink 提供了通用的 WindowAssigner

➢ 滚动窗口(tumbling window)

➢ 滑动窗口(sliding window)

➢ 会话窗口(session window)

➢ 全局窗口(global window)

 

3.2 API实操

• 滚动时间窗口(tumbling time window)

.timeWindow(Time.seconds(15))

• 滑动时间窗口(sliding time window)

.timeWindow(Time.seconds(15),Time.seconds(5))

• 会话窗口(session window)

.Window(EventTimeSessionWindows.withGap(Time.minutes(10)))

• 滚动计数窗口(tumbling count window)

.countWindow(5)

• 滑动计数窗口(sliding count window)

.countWindow(10,2)

3.3 窗口函数(window function)

• window function 定义了要对窗口中收集的数据做的计算操作

• 可以分为两类

➢ 增量聚合函数(incremental aggregation functions)

• 每条数据到来就进行计算,保持一个简单的状态

• ReduceFunction, AggregateFunction

➢ 全窗口函数(full window functions)

• 先把窗口所有数据收集起来,等到计算的时候会遍历所有数据

• ProcessWindowFunction,WindowFunction

3.4 其它可选 API

• .trigger() —— 触发器

➢ 定义 window 什么时候关闭,触发计算并输出结果

• .evictor() —— 移除器

➢ 定义移除某些数据的逻辑

• .allowedLateness() —— 允许处理迟到的数据

• .sideOutputLateData() —— 将迟到的数据放入侧输出流

• .getSideOutput() —— 获取侧输出流

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

步道师就是我

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值