一、安装datax
通过https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202210/datax.tar.gz这个地址下载datax.tar.gz,解压到某个目录,如我的目录/opt/conf/datax-20230301,解压完后会在当前目录下生成datax目录,进入datax目录后的目录如下图所示:
之后在datax安装目录下,运行以下命令,赋予执行权限。
sudo chmod -R 755 ./*
二、测试datax是否正确安装
/opt/conf/datax-20230301/datax/bin/datax.py /opt/conf/datax-20230301/datax/job/job.json
运行以上命令,看是否能正确启动,启动后运行完结果如下图:
如果那个正确运行,说明/opt/conf/datax-20230301/datax/bin/datax.py这个文件的编码不是utf-8,需要重新编码。用我这个替换一下即可正常使用。
datax.py
三、编写配置文件
在datax安装目录下的job文件夹,使用以下命令新建配置文件
vim job_air_data_source_mysql_hdfs.json
之后将下面的json文件内容拷贝粘贴到刚才打开的文件,保存即可。
{
"job": {
"setting": {
"speed": {
"channel": 3
},
"errorLimit": {
"record": 0,
"percentage": 0.02
}
},
"content": [
{
"reader": {
"name": "mysqlreader",
"parameter": {
"username": "root",
"password": "root",
"column": ["*"],
"splitPk": "id",