数据同步工具chunjun(flinkx)-1.12.7 使用tips

省略号的搬运工

已于 2023-03-31 10:37:47 修改

阅读量903

点赞数 1

文章标签： json 大数据数据库 kafka

于 2023-03-18 16:41:42 首次发布

本文链接：https://blog.csdn.net/weixin_44382736/article/details/129622257

版权

本文旨在记录chunjun使用过程中的tips，并且记录与官网描述不符的地方，以减少学习成本

1、在编写json的时候推荐使用在线json编辑器：

2、类似MySQL<—>MySQL这种需要编写带jdbcUrl的任务，注意reader和writer中jdbcUrl类型不一致

3、以kafka—>mysql举例解释字段间的映射关系

4、kafka—>mysql，当kafka输入脏数据时，mysql会写入空行

5、kafkareader，group-offsets模式读不到已提交offset的数据

本文旨在记录chunjun使用过程中的tips，并且记录与官网描述不符的地方，以减少学习成本

最简单快速上手的方法就是熟读官网文档（纯钧 (dtstack.github.io)）中的连接器参数

1、在编写json的时候推荐使用在线json编辑器：

Editor | JSON Crackhttps://jsoncrack.com/editor这个工具可以检查json格式是否正确自动规范json格式，并且可以自动规范json格式，还可以生成树状图直观查看结构，避免因为json格式问题导致任务无法运行

由于json格式问题引发的报错类似：Caused by: com.google.gson.stream.MalformedJsonException: Unterminated array at line 24 column 16 path $.job.content[0].reader.parameter.[1]

检查json格式后可以避免

2、类似MySQL<—>MySQL这种需要编写带jdbcUrl的任务，注意reader和writer中jdbcUrl类型不一致

在reader中jdbcUrl为Array

而writer中jdbcUrl为String

这与官网文档中的描述是不一致的

如果按照官网文档中写法，会产生格式匹配错误：

Caused by: java.lang.IllegalStateException: Expected STRING but was BEGIN_ARRAY at path $.jdbcUrl

3、以kafka—>mysql举例解释字段间的映射关系

kafka topic中有两种数据：

{"id":"1","name":"a1","A1":"0.001","A2":"0.005","A3":"100","A4":"abadc","A5":"eqerd"}
{"id":"2","name":"a2","A1":"0.001","A2":"0.005","A3":"5","A4":"abadc","A5":"eqerd"}
{"id":"3","name":"a3","A1":"0.1","A2":"0.3","A3":"20","A4":"","A5":"qerda"}
{"id":"4","name":"a4","A1":"0.00070","A2":"12.2","A3":"10","A4":null,"A5":"weaef"}
{"id":"5","name":"a5","A1":"0.1","A2":"0.3","A3":"20","A4":"adfsa","A5":"qerda"}
{"id":"6","name":"a1","A1":null,"A2":null,"A3":"100","A4":"abadc","A5":"eqerd"}
{"id":"1","name":"a1","B1":"0.1","B2":"5","B3":"GKLGU"}
{"id":"2","name":"a2","B1":"1.425","B2":"10","B3":"HJFV"}
{"id":"3","name":"a3","B1":"54.12","B2":"4325","B3":"FDGAD"}
{"id":"4","name":"a4","B1":"10.0","B2":"1","B3":null}
{"id":"5","name":"a5","B1":null,"B2":"11","B3":"SDF"}
{"id":"6","name":"a7","B1":null,"B2":null,"B3":null}

第一种包含id、name、A1、A2、A3、A4、A5字段

第二种包含id、name、B1、B2、B3字段

写入目标表字段 id、name、A1、A2、A3、A4、A5、B1、B2、B3

① 实验一：

kafkareader：name、A1、A2、A3、A4、A5、B1、B2、B3

mysqlwriter：name、A1、A2、A3、A4、A5、B1、B2、B3

结果正常写入