Flink watermark

• Event Time (事件时间):事件创建的时间(必须包含在数据源中的元素⾥⾯)
• Ingestion Time (摄⼊时间):数据进⼊ Flink 的 source 算⼦的时间,与机器相关
• Processing Time (处理时间):执⾏操作算⼦的本地系统时间,与机器相关

在这里插入图片描述
⽔位线:系统认为时间戳⼩于⽔位线的事件都已经到达了
因此, Window 的执⾏也是由 Watermark 触发的(⽔位线 >= 窗⼝结束时间)

⽔位线产⽣的公式:⽔位线 = 系统观察到的最⼤事件时间 - 最⼤延迟时间
最⼤延迟时间由程序员⾃⼰设定

实验

1.下载netcat
1)下载netcat,地址:https://eternallybored.org/misc/netcat/(两个版本下载哪个都可以),默认32位的,但是也可以在64位运行
2)将解压后的单个文件全部拷贝到C:\Windows\System32的文件夹下。注意:不是拷贝整个文件夹,而是文件夹里面的全部文件。
3)执行下面命令 nc -l -p 9999(这个命令就是linux下的nc -lk 9999)

2.开启flink从socket中读取数据

package com.claroja;

import org.apache.flink.api.common.eventtime.SerializableTimestampAssigner;
import org.apache.flink.api.common.eventtime.WatermarkStrategy;
import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.TimeCharacteristic;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.windowing.ProcessWindowFunction;
import org.apache.flink.streaming.api.windowing.time.Time;
import org.apache.flink.streaming.api.windowing.windows.TimeWindow;
import org.apache.flink.util.Collector;

import java.time.Duration;

public class WaterMark {
    public static void main(String[] args) throws Exception {
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime);
        env.setParallelism(1);
//        env.getConfig().setAutoWatermarkInterval(60 * 1000L); //默认200ms更新水位线,每进来一个event都记录最新的时间,但200ms才会更新

        DataStreamSource<String> stream = env.socketTextStream("localhost", 9999);
        stream
                .map(new MapFunction<String, Tuple2<String, Long>>() {// Tuple2<key, timestamp>,事件事件必须是毫秒时间戳
                    @Override
                    public Tuple2<String, Long> map(String s) throws Exception {
                        String[] arr = s.split(" ");
                        return Tuple2.of(arr[0], Long.parseLong(arr[1]) * 1000L);
                    }
                })
                .assignTimestampsAndWatermarks(// 水位线必须在keyby之前
                        WatermarkStrategy
                                .<Tuple2<String, Long>>forBoundedOutOfOrderness(Duration.ofSeconds(5))// 最大延迟时间是5s
                                .withTimestampAssigner(new SerializableTimestampAssigner<Tuple2<String, Long>>() {// 设置event_time
                                    @Override
                                    public long extractTimestamp(Tuple2<String, Long> r, long l) {
                                        return r.f1; // 告诉系统元素的事件时间戳是r.f1字段
                                    }
                                })
                )
                .keyBy(r -> r.f0)
                .timeWindow(Time.seconds(5))
                .process(new ProcessWindowFunction<Tuple2<String, Long>, String, String, TimeWindow>() {
                    @Override
                    public void process(String s, Context context, Iterable<Tuple2<String, Long>> iterable, Collector<String> collector) throws Exception {
                        long count = 0L;
                        for (Tuple2<String, Long> i : iterable) {
                            count += 1;
                        }
                        collector.collect("窗口中共有 " + count + " 条元素");
                    }
                })
                .print();

        env.execute();
    }
}

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值