简述窗口开始时间
1.当flink程序启动时,创建的第一个window的开始时间是由程序决定的,具体的算法如下:
2.窗口开始时间=第一条记录时间戳-第一条记录时间戳%窗口时长,也就是从utc0时区的1970-01-01 00:00:00.000开始,像建铁轨一样将无数个窗口时长从那时排列,观察第一条记录时间戳落在了第几条铁轨上,那么这条铁轨的开始时间,就是窗口的开始时间
引出offset
1.这样排列多少有点独断专行了
2.因为假如我要从utc8时区2023-02-24 00:00:00.000开始,定义一个24h的滚动窗口。当第一条记录2023-02-24 10:00:00.000(内部转换为时间戳)到达时,那么程序默认会开启一个utc0时区2023-02-24 00:00:00.000到utc0时区2023-02-24 23:59:59.999的窗口。啊,这并不是我们想要的,因为我们惯用北京时间,希望按北京时间的天统计
3.那么offset来了,上面的窗口对应到北京时间就是:utc8时区2023-02-24 08:00:00.000到utc0时区2023-02-25 07:59:59.999。显而易见,窗口的开始时间,结束时间应该-8h,那么设置offset=-8h就解决了