【工具】DataX 数据同步工具

简介

DataX 是阿里云 DataWorks数据集成 的开源版本,在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX 实现了包括 MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres、DRDS, databend 等各种异构数据源之间高效的数据同步功能。

Quick Start 【Mysql】

  1. 下载https://github.com/alibaba/DataX/releases
  2. 查看如下文档https://github.com/alibaba/DataX, 编写Job json
    在这里插入图片描述

如下所示

{
    "job": {
        "setting": {
            "speed": {
                "channel": 1
            }
        },
        "content": [
            {
                "reader": {
                    "name": "mysqlreader",
                    "parameter": {
                        "username": "root",
                        "password": "root",
                        "column": [
                            "*"
                        ],
                        "splitPk": "id",
                        "connection": [
                            {
                                "table": [
                                    "oss_object"
                                ],
                                "jdbcUrl": [
                                     "jdbc:mysql://ip1:3306/ys-oss?useSSL=false"  // 链接1
                                ]
                            }
                        ]
                    }
                },
                "writer": {
                    "name": "mysqlwriter",
                    "parameter": {
                        "writeMode": "insert",
                        "username": "root",
                        "password": "root",
                        "column": [
                            "*"
                        ],
                        "session": [
                        	"set session sql_mode='ANSI'"
                        ],
                        "preSql": [
                            "delete from oss_object_copy1"
                        ],
                        "connection": [
                            {
                                 "jdbc:mysql://ip1:3306/ys-oss?useSSL=false"  // 链接2
                                "table": [
                                    "oss_object_copy1"
                                ]
                            }
                        ]
                    }
                }
            }
        ]
    }
}

  1. 运行datax.py job1.json
2024-03-19 17:01:46.568 [job-0] INFO  JobContainer -
任务启动时刻                    : 2024-03-19 17:00:34
任务结束时刻                    : 2024-03-19 17:01:46
任务总计耗时                    :                 71s
任务平均流量                    :            1.38MB/s
记录写入速度                    :           9958rec/s
读出记录总数                    :              697071
读写失败总数                    :                   0
  1. 和navicat比较,navicat直接数据同步时间为3分,datax为71s,有进步就好!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

生如夏花般绚丽

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值