1. DataX 是阿里巴巴开源的一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle 等)、HDFS、Hive、ODPS、HBase、FTP 等各种异构数据源之间稳定高效的数据同步功能。
2.在源数据库和目标数据库不能同时连接时,可使用DataX 将需要同步的数据提取出来成CSV格式的数据文件,在到目标数据库,使用DataX将CSV文件数据导入数据库。
步骤1:
创建datax job json文件:
{
"job": {
"setting": {
"speed": {
"channel": 1
}
},
"content": [
{
"reader": {
"name": "mysqlreader",
"parameter": {
"username": "数据库用户名",
"password": "密码",
"connection": [
{
"querySql": [
"select * from table