1、下载
https://github.com/alibaba/DataX
DataX 是阿里云 DataWorks数据集成 的开源版本,在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX 实现了包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres、DRDS 等各种异构数据源之间高效的数据同步功能。
2、使用python3的下载python3的文件
由于DataX3.0发布的版本使用的python2,因此安装包里的3个python文件需要替换成python3版本的。
python3文件下载网址:
https://github.com/WeiYe-Jing/datax-web/tree/master/doc/datax-web/datax-python3
或者
https://github.com/HxYyWw/DatatX_python3/tree/master
3、设置jdk
不再赘述
4、使用模板文件
测试txt2mysql,建一个文件
txt2mysql.json
{
"job": {
"setting": {
"speed": {
"channel": 3