Flink SQL 批处理使用HOP详解

最新推荐文章于 2024-07-26 14:27:23 发布

Scapel

最新推荐文章于 2024-07-26 14:27:23 发布

阅读量3.9k

点赞数 1

分类专栏： Flink 文章标签： flink

本文链接：https://blog.csdn.net/Scapel/article/details/115251669

版权

本文详细介绍了Flink SQL如何在批处理模式下使用HOP窗口函数，适用于每隔固定时间统计一段时间内指标的场景。通过实例解析了滑动间隔小于窗口时间的情况，说明了批处理中HOP窗口的执行逻辑，包括如何按照时间排序、滑动计算以及输出窗口结果。

摘要由CSDN通过智能技术生成

Flink SQL 批处理使用HOP详解

介绍

Flink SQL中分组窗口函数中有一个HOP(time_attr, hop interval 滑动间隔, fixed duration 窗口时间)，适合的场景基本是每隔多长时间统计一次某个时间段内的指标，例如，统计每个用户过去1分钟（窗口时间）的单击次数，每30秒（滑动间隔）更新1次。在流式计算中比较容易理解，但是批处理使用这个函数就会让人摸不着头脑。下面通过一个例子来解释。

表结构及数据

在这里插入图片描述

SQL

    INSERT INTO print
    SELECT a, sum(b) as b_sum
      FROM orders
     GROUP BY a, HOP(rowtime, INTERVAL '1' HOUR, INTERVAL '24' HOUR)
     ORDER BY a

执行结果及解释

+I(a,55)  2021-03-26 09:00:00 ~ 2021-03-26 09:59:59   +55 第一个窗口开始
+I(a,55)
+I(a,55)
+I(a,55)

最低0.47元/天解锁文章

Scapel

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
Flink SQL 批处理使用HOP详解

Flink SQL 批处理使用HOP详解介绍Flink SQL中分组窗口函数中有一个HOP(time_attr, hop interval 滑动间隔, fixed duration 窗口时间)，适合的场景基本是每隔多长时间统计一次某个时间段内的指标，例如，统计每个用户过去1分钟（窗口时间）的单击次数，每30秒（滑动间隔）更新1次。在流式计算中比较容易理解，但是批处理使用这个函数就会让人摸不着头脑。下面通过一个例子来解释。表结构及数据SQL INSERT INTO print SEL
复制链接

扫一扫

专栏目录