datax的udf_DataX的使用

简介

DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、HDFS、Hive、OceanBase、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。DataX采用了框架 + 插件 的模式,目前已开源,代码托管在github。

DataX安装部署及小试

1.下载压缩包

在页面中【Quick Start】--->【Download DataX下载地址】进行下载。下载后的包名:datax.tar.gz。

解压后{datax}目录下有{bin conf job lib log log_perf plugin script tmp}几个目录。

2.安装

将下载后的压缩包直接解压后可用,前提是对应的java及python环境满足要求。

JDK(1.6以上,推荐1.6)

Python(推荐Python2.7.X)一定要为python2,因为后面执行datax.py的时候,里面的python的print会执行不了,导致运行不成功,会提示你print语法要加括号,python2中加不加都行 python3中必须要加,否则报语法错

Apache Maven 3.x (Compile DataX)

3.测试

进入datax目录下的bin中,里面有datax.py文件,可以在cmd中测试:

python D:\datax\bin\datax.py D:\datax\job\job.json

使用即执行一个python脚本,传入json配置文件

配置文件,可以查看模版样例,模版结果显示:

2e4e521888710cf89adf784f07b60029.png

48082e124aa18cd4fb36d9a1964bfedb.png

如果乱码,可以在cmd中输入:

CHCP 65001

使用DataX将mysql数据导入到oracle中

1.配置json

8f900a89c6347c561fdf2122f13be562.png

961ddebeb323a10fe0623af514929fc1.png

{"job": {"content": [

{"reader": {"name": "mysqlreader","parameter": {"username": "****","password": "****","column": ["rank","payment"],"connection": [

{"table": ["salary"],"jdbcUrl": ["jdbc:mysql://127.0.0.1:3306/test"]

}

]

}

},"writer": {"name": "oraclewriter","parameter": {"username": "****","password": "****","column": ["rank","payment"],"preSql": ["delete from oracle_test"],"connection": [

{"jdbcUrl": "jdbc:oracle:thin:@127.0.0.1:1521:test","table": ["oracle_test"]

}

]

}

}

}

],"setting": {"speed": {"channel": 1}

}

}

}

View Code

2.cmd执行

python d:\datax\bin\datax.py E:\datax\Mysql2Oracle.json

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值