自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 FlinkCDC x Paimon进行数据同步 使用paimon-flink-action包 NoClassDefFoundError 依赖问题解决

终极解决方案:第一步:打一个flink-connector-mysql-cdc-3.4.0.jar的胖包,并加入kafka/connect的重定位配置...

2025-06-05 17:27:10 1027

原创 Pyflink二次开发后如何打包代码,并构建成docker镜像?

启动一个交互容器docker run -u root -it --rm flink:2.0.0 /bin/bash。在flink源码处,直接将整个flink-parent进行编译(clean intall),可以看到pyflink.zip文件,将其替换为我们刚才生成的pyflink.zip。然后到你的python环境,比如pycharm,来执行pip命令安装即可。# 官方版的pyflink 应该不用安装了,但是我是先安装了再覆盖的。根据官网的指引,安装python和pyflink。

2025-05-17 12:45:41 424

原创 Pyflink 报错:java.net.MalformedURLException: no protocol: [‘file:/opt/flink/opt/flink-python-1.xx...]

虽然在2.0.0已经解决且合并,但是我公司是用的docker来部署flink集群,docker的官方库的flink 2.0.0是5月19日更新的,这个bug修复是5月20日合并的,而且pip库也是同样还没更新,没办法了,只能自己从最新的源码来构建docker镜像和python库了,如果读者不确定你所在的版本,这个bug有没有修复,可以在flink依赖库中搜索:flink-python/pyflink/common/configuration.py。但是后来我翻了一下社区的邮件,发现有人提过这个问题了。

2025-05-17 12:01:24 402 2

原创 Flink: kafka sink如何指定key?自定义Schema: DynamicKeySerializer

官方的kafka-connector中的kafka sink api 不支持自己指定key,于是我就自己动手写了一个schema来支持这个功能。

2025-04-22 15:29:44 319

原创 Pyflink SimpleStringSchema反序列化器的局限性问题解决,自定义DeserializationSchema

pyflink 在使用kafka source时,可能遇到SimpleStringSchema无法反序列化而报错的情况,比如debezium产生的墓碑事件(value为空)。我们可以自定义反序列化器来解决这个问题。

2025-03-25 11:00:27 496

原创 Pyflink自定义Sink实现,以Neo4j Sink为例

Flink Neo4jSink 的java实现和python实现。java一个小时能写出三种实现,老架构、新架构、新架构v2。pyflink是真的不好用,非必要还是用java api!

2025-03-13 16:36:23 1127

原创 首次贡献Flink源码,竟贡献了3600+行?记录首次PR经历!

祝大家早日成为Contributor!

2025-02-25 16:03:49 985 4

原创 Flink源码编译完成之后,部分代码构建后显示找不到

比如说以下代码:flink-table/flink-sql-parser/src/main/java/org/apache/flink/sql/parser/dql/SqlShowDatabases。另外建议强迫症选手在此后不要点开ParseException类哈,不然会报红让你把目录已到项目根目录去,显然咱们不可能移过去,虽然不影响使用,但是看着很烦。原因:这个目录其实是flink运行时由javacc生成的,我们编译完成后,可以在target目录找到它。

2025-02-19 15:37:26 189

原创 Flink源码编译报错Connect to repository.apache.org:443 [repository.apache.org/65.109.119.155] failed: Conne

开启vpn时,部分流量没有代理,即使是全局代理,也会有同样报错,解决方式:开启vpn TUN代理模式,即可代理本机所有流量。

2025-02-18 19:53:28 199

原创 flink源码编译时flink-runtime-web模块报错npm相关

看看这两个文件是否完整(看大小),如果不完整,删掉这个文件,再重新clean install,还不行可以自己去网上下载node.exe文件放进来。编译了三四次源码了,flink版本1.16 1.18 1.20,分别在各种不同环境下编译都遇到了这个报错,有时候node.js和npm一起报错。首先在flink-runtime-web的pom文件找到这一行,将npm镜像改为。这次我编译比较顺利,暂时没有遇到其他问题,以后有机会再收集其他的问题。node.js报错的话,找到本地仓库地址。

2025-01-27 15:46:32 1673

原创 PyFlink/Flink datastream api写ES无法写复合数据类型的一种解决方案

pyflink/flink 写ES 无法写复合数据类型???

2025-01-27 10:05:11 308

原创 编译flink源码报错Too many files with unapproved license: 8 See RAT report in

编译flink源码时报错 Too many files with unapproved license: 8 See RAT report in: D:\apache-maven-3.9.9\mvn_repo\flink-1.20.0\flink-formats\flink-avro\target\rat.txt。在IDEA的设置里找到Maven->Runner,VM Options添加 -Drat.skip=true。

2025-01-27 09:11:53 270

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除