Flink自定义开窗起始时间

该博客探讨了如何在Flink中利用自定义窗口处理数据统计问题。作者指出,由于Flink的标准滚动窗口以数据发生时间和偏移量定义,因此在特定场景下(如每10分钟统计最大值、最小值等)实现起来较为复杂。为解决这个问题,作者提出了创建一个名为`MyEventTimeWindow`的自定义窗口类,该类允许以10分钟为单位进行窗口划分,并详细解释了其工作原理和代码实现。
摘要由CSDN通过智能技术生成

需求

网关上报的数据以整点时间:进行10分钟,半小时,一小时各统计一下最大值,最小值,平均值,总数和次数;

分析

需要开窗函数,5分钟的窗口以 00;05;10;15.。。。为起点开窗。
10分钟的窗口以 00;10;20;30.。。。为起点开窗。

flink 的滚动开窗时间是以数据发生时间,偏移量,窗口大小 判定的
    public static long getWindowStartWithOffset(long timestamp, long offset, long windowSize) {
    return timestamp - (timestamp - offset + windowSize) % windowSize;
}

时间的执行时间是不确定的,,窗口大小是确定的,偏移量需要自己计算,
这似乎不好弄!

解决方案

使用自定义窗口,用自己的方式去约定窗口的开始时间;如下是以10分钟为窗口进行自定义开窗


import cn.hutool.core.date.DateField;
import cn.hutool.core.date.DateUtil;
import org.apache.flink.api.common.ExecutionConfig;
import org.apache.flink.api.common.typeutils.TypeSerializer;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.windowing.assigners.WindowAssigner;
import org.apache.flink.streaming.api.windowing.time.Time;
import org.apache.flink.streaming.api.windowing.triggers.ProcessingTimeTrigger;
import org.apache.flink.streaming.api.windowing.triggers.Trigger;
import org.apache.flink.streaming.api.windowing.windows.TimeWindow;

import java.util.Collection;
import java.util.Collections;


public class MyEventTimeWindow extends WindowAssigner<Object, TimeWindow> {

    // 窗口的大小
    private final long size;
    // 多长时间滑动一次
    private final long slide;
    // 时间点
    private final int startTime;

    protected MyEventTimeWindow(long size, long slide, int startTime) {
        this.size = size;
        this.slide = slide;
        this.startTime = startTime;
    }

    public static MyEventTimeWindow of(Time size, Time slide, int startTime) {
        return new MyEventTimeWindow(size.toMilliseconds(), slide.toMilliseconds(), startTime);
    }

    public static MyEventTimeWindow of(Time size, Time slide) {
        return new MyEventTimeWindow(size.toMilliseconds(), slide.toMilliseconds(), 0);
    }

    @Override
    public Collection<TimeWindow> assignWindows(Object element, long timestamp, WindowAssignerContext context) {
        timestamp = context.getCurrentProcessingTime();
        int minute = DateUtil.date(timestamp).minute();
        // 当时 以10为倍数的起点的余数值
        int t10Minys = minute%startTime;
        // 是当前分钟的第几秒
        int second = DateUtil.date(timestamp).second();
        // 是当前秒的第几毫秒
        int millsecond = DateUtil.date(timestamp).millsecond();
        // 当前时间向前偏移; 如果是07分钟的数据,开始时间就是00;
        long lastStart =  DateUtil.date(timestamp).offset(DateField.MILLISECOND,-((t10Minys*60+second)*1000+millsecond)).getTime();
        return Collections.singletonList(new TimeWindow(lastStart, lastStart + this.size));
    }

    @Override
    public Trigger<Object, TimeWindow> getDefaultTrigger(StreamExecutionEnvironment streamExecutionEnvironment) {
        return ProcessingTimeTrigger.create();
    }

    @Override
    public TypeSerializer<TimeWindow> getWindowSerializer(ExecutionConfig executionConfig) {
        return new TimeWindow.Serializer();
    }

    @Override
    public boolean isEventTime() {
        return true;
    }

}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值