编译DataX

下载 DataX

首先,访问 DataX 官网地址 https://github.com/alibaba/DataX/ 进行下载
在这里插入图片描述

编译 DataX

下载后解压 DataX,在确保已经安装了maven之后,进入DataX目录,执行 mvn -U clean package assembly:assembly -Dmaven.test.skip=true 命令进行编译。

  • 使用-U参数: 该参数能强制让Maven检查所有SNAPSHOT依赖更新,确保集成基于最新的状态,如果没有该参数,Maven默认以天为单位检查更新,而持续集成的频率应该比这高很多。
  • clean: clean能够保证上一次构建的输出不会影响到本次构建。
  • maven中有多种插件提供了打包功能,分别是maven-jar-plugin(用来打包成jar包),maven-war-plugin(打包成war包)、maven-assembly-plugin。
  • 最常用的打包命令有mvn clean package、mvn clean install、mvn clean deploy,这三个命令都可完成打jar包或war(当然也可以是其它形式的包)的功能,但这三个命令还是有区别的
    1. package命令完成了项目编译、单元测试、打包功能,但没有把打好的可执行jar包(war包或其它形式的包)布署到本地maven仓库和远程maven私服仓库
    2. install命令完成了项目编译、单元测试、打包功能,同时把打好的可执行jar包(war包或其它形式的包)布署到本地maven仓库,但没有布署到远程maven私服仓库
    3. deploy命令完成了项目编译、单元测试、打包功能,同时把打好的可执行jar包(war包或其它形式的包)布署到本地maven仓库和远程maven私服仓库
  • maven中有多种插件提供了打包功能,分别是maven-jar-plugin(用来打包成jar包),maven-war-plugin(打包成war包)、maven-assembly-plugin
  • -D 表示 Properties属性,而 -P 表示 Profiles配置文件
  • 在使用mvn package进行编译、打包时,Maven会执行src/test/java中的JUnit测试用例,有时为了跳过测试,会使用参数-DskipTests和-Dmaven.test.skip=true,这两个参数的主要区别是:
    1. -DskipTests,不执行测试用例,但编译测试用例类生成相应的class文件至target/test-classes下
    2. -Dmaven.test.skip=true,不执行测试用例,也不编译测试用例类

java14以上的编译问题

如果 java 版本是14以下,那么不会有问题。如果 java 版本跟我一样是 15,则会报如下错误
在这里插入图片描述
由于在 Java15,Oracle新增了一个 java.lang.Record 类,因此如果这么导入 import com.alibaba.datax.common.element.*; 编译器无法判断,到底是引用 com.alibaba.datax.common.element.Record,还是引用 java.lang.Record,因此报错。

使用find . -name *.java | xargs grep -F 'com.alibaba.datax.common.element.*' 来查找有哪些引发混淆的文件。

  • find 命令用来指定文件类型,点号表示当前路径
  • xargs是一个给其他命令传递参数的过滤器
  • grep -F 表示查找文件中是否包含某个字符串,-F表示纯粹的字符串(默认使用正则表达式匹配)
  • grep -l 可以只显示文件路径,不显示匹配到的内容

在这里插入图片描述
有两种方法进行替换

  1. 使用vim逐个替换。例如vim /home/chen/Documents/DataX-master/core/src/main/java/com/alibaba/datax/core/transport/transformer/FilterTransformer.java,然后使用命令 :%s#Record #com.alibaba.datax.common.element.Record #g进行批量替换,为所有 Record 明确其引用的包名。替换完后,再输入 :wq 对修改进行保存并退出。这个方法少量文件还好,要是文件多的话,就十分麻烦了。
  2. 使用sed命令批量处理,将 Record 替换为 com.alibaba.datax.common.element.Record
sed -i 's/Record /com.alibaba.datax.common.element.Record /g' `find . -name *.java | xargs grep -F 'com.alibaba.datax.common.element.*'`

在这里插入图片描述手动处理下下面文件

/home/chen/Documents/DataX-master/odpsreader/src/main/java/com/alibaba/datax/plugin/reader/odpsreader/ReaderProxy.java
/home/chen/Documents/DataX-master/streamreader/src/main/java/com/alibaba/datax/plugin/reader/streamreader/StreamReader.java
/home/chen/Documents/DataX-master/mongodbwriter/src/main/java/com/alibaba/datax/plugin/writer/mongodbwriter/MongoDBWriter.java
/home/chen/Documents/DataX-master/hbase11xsqlreader/src/main/java/com/alibaba/datax/plugin/reader/hbase11xsqlreader/HbaseSQLReaderTask.java
/home/chen/Documents/DataX-master/hbase20xsqlreader/src/main/java/com/alibaba/datax/plugin/reader/hbase20xsqlreader/HBase20xSQLReaderTask.java

在vim中:行号可以直接跳转到指定行

某个库找不到的解决办法

如果遇到某个包下载不到,使用浏览器进入 https://public.nexus.pentaho.org/service/rest/repository/browse/omni/ 页面手动下载到 m2 的对应目录即可
在这里插入图片描述
在这里插入图片描述

找不到 oscarJDBC.jar

[ERROR] Failed to execute goal on project oscarwriter: Could not resolve dependencies for project com.alibaba.datax:oscarwriter:jar:0.0.1-SNAPSHOT: Could not find artifact com.oscar:oscar:jar:7.0.8 at specified path /home/chen/Documents/DataX-master/oscarwriter/src/main/lib/oscarJDBC.jar -> [Help 1]

在这里插入图片描述这个是阿里工程师的失误,网上也找不到这个包,因此进入pom.xml,注释该选项即可

<!--
<dependency>
    <groupId>com.oscar</groupId>
    <artifactId>oscar</artifactId>
    <version>7.0.8</version>
    <scope>system</scope>
    <systemPath>${basedir}/src/main/lib/oscarJDBC.jar</systemPath>
</dependency>
-->

编译成功

在这里插入图片描述
编译好的文件都放在 target 目录下
在这里插入图片描述

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值