flink生成Watermark之WatermarkStrategy

本文介绍了Flink中三种Watermark策略:固定乱序长度策略(forBoundedOutOfOrderness)、单调递增策略(forMonotonousTimestamps)和不生成策略(noWatermarks)。forBoundedOutOfOrderness允许一定范围的乱序,根据最大乱序时间生成Watermark。forMonotonousTimestamps策略适用于时间戳单调递增的场景。noWatermarks策略则不生成Watermark,可能导致内存问题。此外,还提到了withIdleness方法来处理流状态和空闲超时。
摘要由CSDN通过智能技术生成


flink1.11版本后 建议用WatermarkStrategy(Watermark生成策略)生成Watermark,当创建DataStream对象后,使用如下方法指定策略: assignTimestampsAndWatermarks(WatermarkStrategy<T>)
我们只需要 实现WatermarkGenerator<T>接口即可,该接口中有2个方法: onEvent方法在接收到每一个事件数据时就会触发调用,第一个参数event为接收的事件数据,第二个参数eventTimestamp表示事件时间戳,第三个参数output可用output.emitWatermark方法生成一个Watermark。 onPeriodicEmit方法会周期性触发,比每个元素生成一个Watermark效率高。接收一个WatermarkOutput类型的参数output,内部可用output.emitWatermark方法生成一个Watermark。

@Public
public interface WatermarkGenerator<T> {
   
    /**
     * Called for every event, allows the watermark generator to examine and remember the event
     * timestamps, or to emit a watermark based on the event itself.
     */
    void onEvent(T event, long eventTimestamp, WatermarkOutput output);
    /**
     * Called periodically, and might emit a new watermark, or not.
     *
     * <p>The interval in which this method is called and Watermarks are generated depends on {@link
     * ExecutionConfig#getAutoWatermarkInterval()}.
     */
    void onPeriodicEmit(WatermarkOutput output);
}

固定乱序长度策略(forBoundedOutOfOrderness)

通过调用WatermarkStrategy对象上的forBoundedOutOfOrderness方法来实现,接收一个Duration类型的参数作为最大乱序(out of order)长度。WatermarkStrategy对象上的withTimestampAssigner方法为从事件数据中提取时间戳提供了接口

//在assignTimestampsAndWatermarks中用WatermarkStrategy.forBoundedOutOfOrderness方法抽取Timestamp和生成周期性水位线示例
public class Test{
   
    public static void main(String[] args) throws  Exception{
   
        //创建流处理环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        //设置EventTime语义
        env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime);
        //设置周期生成Watermark间隔(10毫秒)
        env.getConfig().setAutoWatermarkInterval(10L);
        //并行度1
        env.setParallelism(1);
        //演示数据
        DataStreamSource<ClickEvent> mySource = env.fromElements(
                new ClickEvent("user1", 1L, 1),
                new ClickEvent("user1", 2L, 2),
                new ClickEvent("user1", 3L, 3),
                new ClickEvent("user1", 4L, 4),
                new ClickEvent("user1"
  • 7
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小程序猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值