Flink Windows Join 都是 Inner Join
两个流join时,先做join操作,形成JoinedStream,然后再指定Window,最后接着join后的transform操作。
案例:
inputStream1:DataStream[(Long,String,Int)] = ...
inputStream2:DataStream[(String,Long,Int)] = ...
//通过DataStream Join方法将两个数据流关联
inputStream1.join(inputStream2)
//指定inputStream1的关联Key
.where(_._1)
//指定inputStream2的关联Key
.equalTo(_._2)/
//指定Window Assigner
.window(TumblingEventTimeWindows.of(Time.milliseconds(10)))
.apply(<JoinFunction>) //指定窗口计算函数
根据窗口的不同,数据计算的方式不同
根据窗口的选择,依次对应于:
滚动窗口关联:Tumbling Window Join
滑动窗口关联:Sliding Window Join
会话窗口关联:Session Window Join
间隔关联:Interval Join
间隔关联 Join
间隔关联与其他窗口关联不同,间隔关联的数据元素关联范围不依赖窗口划分,而是通过DataS