Flink-源码Bug修复和二次开发实践

最新推荐文章于 2024-03-24 16:24:48 发布

迷路剑客

最新推荐文章于 2024-03-24 16:24:48 发布

阅读量900

点赞数 1

分类专栏： flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baichoufei90/article/details/111128172

版权

flink 专栏收录该内容

18 篇文章 18 订阅

订阅专栏

Flink-源码Bug修复和二次开发实践

1 Bug修复

解决Flink Sql DDL 中使用time作为字段关键字某些场景报错的Bug
flink 1.10
解决Json反序列化时，如果内容带\时，TextNode直接转ObjectNode接续报错的Bug

2 新增功能

2.1 KuduConnector

参考了bahir-flink ，基于Flink 1.11 ，围绕最新的RowData类型，实现以下功能：

KuduDynamicSink
可直接Flink Sql流式写入Kudu。还有继续优化空间。
KuduDynamicSource
实现了
- ScanTableSource,
- SupportsProjectionPushDown
- LookupTableSource,
  - 支持了实现自AsyncTableFunction的AsyncKuduRowDataLookupFunctionV2，基于Flink 异步IO，用于异步读取Kudu表数据。
    还加入了两个缓存：
    - Cache<RowData, List<RowData>>用来缓存join keys对应的数据；
    - Cache<RowData, CompletableFuture<List<RowData>>>用于缓存join keys对应的CompletableFuture，最大限度减少短时间内同key数据对kudu的访问
    - 以上Cache基于Guava Cache，后期准备对比测试Caffeine Cache性能以决定是否替换
  - 目前可达到几万条/秒，同时又不对kudu造成较大压力

2.2 ElasticsearchConnector

基于Flink 1.11，围绕最新的RowData类型，实现以下功能：

Elasticsearch6DynamicSource
- 实现了 LookupTableSource, SupportsProjectionPushDown
  主要用于Elasticsearch维表join
  - 支持了实现自AsyncTableFunction的AsyncKuduRowDataLookupFunctionV2，基于Flink 异步IO，用于异步读取Kudu表数据。
    还加入了两个缓存：
    - Cache<RowData, List<RowData>>用来缓存join keys对应的数据；
    - Cache<RowData, CompletableFuture<List<RowData>>>用于缓存join keys对应的CompletableFuture，最大限度减少短时间内同key数据对kudu的访问

2.3 Parquet+LZO

Flink 1.10中，加入了对Parquet格式下LZO压缩的支持，且已经投入生产，节约过半硬盘空间。

2.4 Kafka CDC MaxWell Format

可实现MaxWell解析的Binlog推送到Kafka后的CDC对接，转为Flink内部统一识别的RowData。可支持增删改查。

附录

打包命令

clean package -T 2C -Dfast -Dmaven.compile.fork=true 
-DskipTests -Dscala-2.11 -Dmaven.javadoc.skip=true -Dcheckstyle.skip=true -e -X -f pom.xml

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Flink-源码Bug修复和二次开发实践

Flink-源码Bug修复和二次开发实践==1 Bug修复解决Flink Sql DDL 中使用time作为字段关键字某些场景报错的Bugflink 1.10解决Json反序列化时，如果内容带\时，TextNode直接转ObjectNode接续报错的Bug2 新增功能2.1 KuduConnector参考了bahir-flink ，基于Flink 1.11 ，围绕最新的RowData类型，实现以下功能：KuduDynamicSink可直接Flink Sql流式写入Kudu。还有继续优
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。