简介
DataX 是阿里云 DataWorks数据集成 的开源版本,在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX 实现了包括 MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres、DRDS, databend 等各种异构数据源之间高效的数据同步功能。
Quick Start 【Mysql】
- 下载https://github.com/alibaba/DataX/releases
- 查看如下文档https://github.com/alibaba/DataX, 编写
Job json
:
如下所示
{
"job": {
"setting": {
"speed": {
"channel": 1
}
},
"content": [
{
"reader": {
"name": "mysqlreader",
"parameter": {
"username": "root",
"password": "root",
"column": [
"*"
],
"splitPk": "id",
"connection": [
{
"table": [
"oss_object"
],
"jdbcUrl": [
"jdbc:mysql://ip1:3306/ys-oss?useSSL=false" // 链接1
]
}
]
}
},
"writer": {
"name": "mysqlwriter",
"parameter": {
"writeMode": "insert",
"username": "root",
"password": "root",
"column": [
"*"
],
"session": [
"set session sql_mode='ANSI'"
],
"preSql": [
"delete from oss_object_copy1"
],
"connection": [
{
"jdbc:mysql://ip1:3306/ys-oss?useSSL=false" // 链接2
"table": [
"oss_object_copy1"
]
}
]
}
}
}
]
}
}
- 运行
datax.py job1.json
2024-03-19 17:01:46.568 [job-0] INFO JobContainer -
任务启动时刻 : 2024-03-19 17:00:34
任务结束时刻 : 2024-03-19 17:01:46
任务总计耗时 : 71s
任务平均流量 : 1.38MB/s
记录写入速度 : 9958rec/s
读出记录总数 : 697071
读写失败总数 : 0
- 和navicat比较,navicat直接数据同步时间为3分,datax为71s,有进步就好!