flink 双流jion 使用union all + groupby方式实现

王树民

于 2022-09-30 14:03:30 发布

阅读量826

点赞数

分类专栏： flink 文章标签： servlet java 数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangshuminjava/article/details/127122555

版权

flink 专栏收录该内容

73 篇文章 9 订阅

订阅专栏

1、简述

在基于flink的实时计算中，会有实时流join的需求，公司目前使用的是flink1.11版本，是实际的生产中，发现效果不好，甚至几乎join不到，同时多流join显得比较复杂，和同事沟通同时结合自己实践经验，想到使用union + window groupby的方式来实现多流jion。

flink 双流join 文档：Apache Flink 1.12 Documentation: 流上的 Join

2、代码实践

insert into table_sink
SELECT
user_id,
min(client_time) client_time,
record_id,
max(client_ip) client_ip,
max(card_name) card_name,
max(event_type) event_type
FROM (

select
client_time,
user_id
record_id,
client_ip,
'' card_name,
'' event_type
from table_a
where REGEXP(substr(client_time,1,10),'[0-9]{4}-[0-9]{2}-[0-9]{2}')

union all

select
client_time,
user_id
record_id,
'' client_ip,
'' card_name,
'' event_type
from table_b
where REGEXP(substr(client_time,1,10),'[0-9]{4}-[0-9]{2}-[0-9]{2}')

union all

select
client_time,
user_id
record_id,
'' client_ip,

card_name,
event_type
from table_c
where REGEXP(substr(client_time,1,10),'[0-9]{4}-[0-9]{2}-[0-9]{2}')

)x GROUP BY user_id, record_id,TUMBLE(proctime(), INTERVAL '10' second)
3、实践经验

上面sql代码，公司业务每天的数据量有几个亿，同时在3秒内完成业务流程。实际分配的exectur是4G，发现超过10秒窗口后，就频繁GC报错，所以根据实际的业务场景，时间窗口越大，资源消耗越大，这一点需要注意。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
flink 双流jion 使用union all + groupby方式实现

在基于flink的实时计算中，会有实时流join的需求
复制链接

扫一扫

专栏目录

王树民 CSDN认证博客专家 CSDN认证企业博客

码龄8年

561: 原创

2万+: 周排名

123万+: 总排名

490万+: 访问

: 等级

3万+: 积分

906: 粉丝

721: 获赞

371: 评论

3150: 收藏

私信

关注

热门文章

分类专栏

最新评论

出现 org.springframework.beans.factory.BeanCreationException 异常的原因及解决方法
m0_55165974: 也可能是java版本不对，看下是否匹配
druid集群的安装和验证
卡林神不是猫: 王老师您好！请问拷贝Hadoop的jar包去哪里拷贝呢？
地图瓦片编号与经纬度的换算关系
weixin_45506583: 具体怎么算呢？已知列号、行号、缩放等级，怎么转换成两个经纬度呢
byte为什么是-128-127
做而论道_CS: 由补码换算到十进制数，是极其简单的事！你只需记住：【补码首位的权，是负数】。一般的八位二进制数，各个位的权是：　　128、64、32、16、8、4、2、1。如果是八位的补码，各个位的权则是：　－128、64、32、16、8、4、2、1。例如，有一个补码是：1110 0001，它代表的十进制就是：－128 + 64 + 32 + 1 = －31。如果，换另一个补码：0110 0001，它代表的十进制数是：0 + 64 + 32 + 1 = ＋97。仅仅使用【进制转换】，不就完事了嘛？原码反码取反加一？根本就用不着啊。想都不用想！
byte为什么是-128-127
做而论道_CS: 补码的来历，仅仅是在于：你如何处理进位。补码，并不是来自：　机器数真值符号位原码反码正数三码相同负数取反加一符号位不变模同余。。。计算机专家，如果小学毕了业，就不会费这么大的事来解释补码！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。