Flink SQL在线调试功能的实现

4 篇文章 0 订阅
2 篇文章 0 订阅

Flink SQL在线调试功能能够帮助用户数据探索与逻辑校验,调试功能要求如下:

调试时的SQL与线上SQL一致
不能对线上数据产生影响
限制消耗资源
方便快捷地获取到预览结果
限制运行时长

为了满足上述要求,我们开发了基于redis的调试插件,用该插件替换原sink目标,具体步骤如下:

sql翻译时替换sink为专用的flink-connector-redis
flink-connector-redis为自研connector,提供限流功能,利用反压机制达到总体限流,并限制执行时间
调试使用默认有限资源
调试结果从测试专用的redis中获得

本示例基于flink-connector-redis展示如何使用限流、定时关闭等功能。

1.创建一个限流表

create table limited_sink_table (user_name varchar, passport varchar) 
with ( 'connector' = 'redis',
		'host' = '10.11.69.176',
		'port' = '6379',
		'redis-mode' = 'single',
		'password' = '***',
		'command' = 'LPUSH',  --将结果放入到list中
		'sink.limit' = 'true',  -- 开启限流
		'sink.limit.interval'='100', -- 每线程写入间隔
		'sink.limit.max-online' = '1500000', -- 每线程最大在线调试时间150秒
		'sink.limit.max-num' = '10000');  -- 每线程最大写入量

2.替换原SQL的sink

insert into kafka_table select user_name, passport from source_table;
变为:
insert into limited_sink_table select user_name, passport from source_table; 

3. 前端页面展示调试结果

通过rpop读取redis内测试数据。

项目地址:

插件地址:https://github.com/jeff-zou/flink-connector-redis.git

无法翻墙:https://gitee.com/jeff-zou/flink-connector-redis.git

使用方法:

在命令行执行 mvn package -DskipTests打包后,将生成的包flink-connector-redis-1.2.1.jar引入flink lib中即可,无需其它设置。
项目依赖Lettuce 6.2.1,如flink环境无lettuce,则使用flink-connector-redis-1.2.1-jar-with-dependencies.jar
开发环境工程直接引用:

<dependency>
    <groupId>io.github.jeff-zou</groupId>
    <artifactId>flink-connector-redis</artifactId>
    <version>1.2.1</version>
</dependency>
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值