前言
窗口是flink作为实时计算中的一个重要的概念,也称TimeWindow, TimeWindow是将指定时间范围内的所有数据组成一个 window,一次对一个window 里面的所有数据进行计算
flink中的窗口类型
-
滚动窗口
Flink 默认的时间窗口根据 Processing Time 进行窗口的划分,将 Flink 获取到的数据根据进入 Flink 的时间划分到不同的窗口中
DataStream<Tuple2<String, Double>> minTempPerWindowStream = dataStream
.map(new MapFunction<SensorReading, Tuple2<String, Double>>() {
@Override
public Tuple2<String, Double> map(SensorReading value) throws
Exception {
return new Tuple2<>(value.getId(), value.getTemperature());
}
})
.keyBy(data -> data.f0)
.timeWindow( Time.seconds(15) )
.minBy(1);
使用TimeWindow相关API时,需要基本明确其计算模型,flink的窗口概念很像是算法中的桶的概念,即把一个时间窗口范围内的数据根据一定的业务字段分组后,归到这个“桶”中,然后基于这个“桶”中的数据做各种计算、归并等业务操作