- 下载地址
此前已经开源DataX1.0版本,此次介绍为阿里云开源全新版本DataX3.0,有了更多更强大的功能和更好的使用体验。
Github主页地址:https://github.com/alibaba/DataX
DataX是阿里云DataWorks数据集成的开源版本。
- 支持的数据源有哪些(几乎所有)
- 安装
链接: https://pan.baidu.com/s/1AQ8n1eFyqQNsyf7R6id3VQ?pwd=6666
1、上传 /opt/modules
2、解压 tar -zxvf datax.tar.gz -C /opt/installs
3、修改/etc/profile
配置环境变量:
export DATAX_HOME=/opt/installs/datax
export PATH=$PATH:$DATAX_HOME/bin
source /etc/profile
job目录下:
datax.py job.json
表示完成!
假如你运行报错如下:
报错:
配置信息错误,您提供的配置文件[/opt/installs/datax/plugin/reader/._drdsreader/plugin.json]不存在. 请检查您的配置文件
解决方法:
rm -rf /opt/installs/datax/plugin/*/._*
- 因为以后要链接mysql数据库,mysql数据库的驱动包少不了:
链接: https://pan.baidu.com/s/1GpC7ZY9bncYNezKLMYlCGQ?pwd=6666
放在:/opt/installs/datax/lib/