在真实世界中的,无时无刻不在生产数据,这些数据都是无界的,窗口的存在就是将无界的的数据流切割为有限的数据流的方式。
一般来说,根据业务类型,窗口可以分成两大类,:
1、时间窗口(Time Window)
- 滚动窗口
- 滑动窗口
- 会话窗口
2、计数窗口(Count Window)
- 滚动窗口
- 滑动窗口
时间窗口与计数窗口的差异:
时间窗口:是指按时间周期来计算窗口,如设置10S的滚动窗口,则代表每10S执行一次,计算的是这10S内产生的数据。
计数窗口:是指按数据数量来计算窗口,如设置10的滚动窗口,则代表每10条数据执行一次,计算的是这10条数据。
滚动窗口
介绍:数据按固定的时间长度进行切割。
特点:时间对齐,窗口长度固定,没有重叠。
滑动窗口</