业务需求:根据id将两个流中的数据匹配在一起组合成新的流数据,默认两个流的最大延迟时间为60s
超过60s还未匹配成功,意味着当前只有一个流来临,则任务流信息异常,需要将数据侧流输出
思路:先将两个流keyBy(),再connect,然后调用CoProcessFunction函数,在里面处理流1和流2,再设置一个60s的定时器,如果60s内另一个流没来,则把达到的流侧输出
直接上代码:
// 流1 要先按照id分组,再设置水印和事件时间,因为后面注册的定时器是基于事件时间的
DataStreamSource<Order> sourceStream1 = env.addSource(consumer);
KeyedStream<Order, String> stream1 = sourceStream1.assignTimestampsAndWatermarks(new BoundedOutOfOrdernessTimestampExtractor<Order>(Time.seconds(5)) {
@Override
public long extractTimestamp(Order element) {
// 这里从element中获取事件时间
return Order.getTime;
}
}).keyBy(Order::getOrderId);
// 流2 要先按照id分组,再设置水印和事件时间,因为后面注册的定时器是基于事件时间的
DataStreamSource<Order> sourceStream2 = env.addSource(consumer);
KeyedStream<Order, String> stream2 &