Linux安装DataX(Python3)


一、DataX3.0介绍

官网地址:https://github.com/alibaba/DataX/blob/master/introduction.md


二、环境检查

  1. JDK(1.8以上,推荐1.8)
java -version
  1. Python(2或3都可以),推荐python2(python3运行datax.py会提示语法问题,需进行调整。调整方法见本文第四章节)
python -V

若提示"-bash: python: command not found"
1)找到系统自带的python,一般在/usr/bin目录下

find /usr/bin -name 'python*'

在这里插入图片描述

2)若有/usr/bin/python,可以通过 ln -sf /usr/bin/pythonX.X /usr/bin/python 建立软连接,也可以直接使用pythonX
在这里插入图片描述


三、下载、上传、解压

  1. 下载地址:https://github.com/alibaba/DataX/blob/master/userGuid.md
    在这里插入图片描述
  2. 上传至/opt/DataX目录
  3. 解压
cd /opt/DataX/
tar -zxvf datax.tar.gz

四、运行自检脚本

若使用python3,需调整bin文件夹下的.py文件:

  • print XXX 调整为 print(XXX)
  • Exception, e 调整为 Exception as e
    在这里插入图片描述
cd /opt/DataX/datax/bin
python3 datax.py ../job/job.json

启动仍然提示错误:
在这里插入图片描述
需要删除reader和writer目录中 隐藏的下划线文件。分别在reader和writer目录下执行:

ls -las
rm -rf ._*

五、实际运用

  1. 在/opt/DataX/datax/bin目录下执行语句,生成配置模板
python3 datax.py -r streamreader -w streamwriter

在这里插入图片描述

  1. 复制配置模板内容,保存为json文件

  2. 根据本文第一章节官网中的插件体系,调整json文件内容
    在这里插入图片描述

  3. 上传json文件至/opt/DataX/datax/job目录,执行

cd /opt/DataX/datax/bin
python3 datax.py ../job/myJob.json
  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值