Flink之Watermark

本文介绍了Flink中的时间定义,包括处理时间和事件时间。重点讲解了Watermark的概念,如何为有序流和乱序流生成Watermark,例如使用`forMonotonousTimestamps()`和`forBoundedOutOfOrderness()`策略,并通过`TimestampAssigner`提取事件时间。
摘要由CSDN通过智能技术生成


一、Flink 中的时间定义

  1. 处理时间(Processing Time)

    处理时间的概念非常简单,就是指执行处理操作的机器的系统时间。

  2. 事件时间(Event Time)

    事件时间,是指每个事件在对应的设备上发生的时间,也就是数据生成的时间。

二、水位线(Watermark)

2.1、生成水位线

2.1.1 有序流

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
env.setParallelism(2);
SingleOutputStreamOperator<Event> inputDS = env.fromElements(
        new Event("Mary", "./home", 2000L))
// 有序流watermark生成
.assignTimestampsAndWatermarks(WatermarkStrategy.<Event>forMonotonousTimestamps().withTimestampAssigner(new SerializableTimestampAssigner<Event>() {
            @Override
            public long extractTimestamp(Event element, long recordTimestamp) {
                return element.timestamp;
            }
        })
);

2.1.2 乱序流

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
env.setParallelism(2);
SingleOutputStreamOperator<Event> inputDS = env.fromElements(
        new Event("Mary", "./home", 2000L))
// 乱序流watermark生成
.assignTimestampsAndWatermarks(WatermarkStrategy.<Event>forBoundedOutOfOrderness(Duration.ofSeconds(2)).withTimestampAssigner(new SerializableTimestampAssigner<Event>() {
	    @Override
	    public long extractTimestamp(Event element, long recordTimestamp) {
	        return element.timestamp;
	    }
	})
);
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值