1.背景
当我们导入的数据的结果不准确,需要将正确的结果覆盖错误结果的时候,往往需要执行一个先删除再导入的操作。虽然seatunnel导入mysql有overwrite模式,可以实现覆盖插入的操作,但是,当我们遇到错误的结果要比正确的结果要多时,覆盖模式并不能把所有的错误结果都覆盖掉。所以最好最理想的做法,还是执行先删除,后导入mysql的操作。
2.问题
虽然确定了最理想的执行方式是先执行mysql的删除操作,再进行导入到mysql的操作,但是seatunnel并没有提供一个这样的配置方式:
点击查看seatunnel的mysql output配置详情
所以,需要我们稍微改造一下seatunnel的源代码来实现先删后导的功能。
3.如何实现
首先需要下载seatunnel的源代码。我用的是incubator-seatunnel-1.5.7版本,下载地址:https://github.com/apache/incubator-seatunnel/releases/tag/v1.5.7https://github.com/apache/incubator-seatunnel/releases/tag/v1.5.7
下载完之后,需要用已经整合好scala2.11.x和sbt打包工具的IntelliJIDEA进行打开,这样会少踩坑。
成功引入seatunnel的源码导idea之后,我们找到waterdrop-core模块下的src目录下的如图所示的类