datax官方文档_DATAX的一个完整实践记录

be685d4c7b19e7a5715839d90157f316.png

缘起:

近期生产系统有从其他系统获取数据进行功能判断的依据。基于个人坚持的系统之间尽量解耦的原则,果断建议了etl同步方式。因为之前对kettle+taskctl方式比较熟悉,也对商业的DataPipeline有过一定的接触和了解,因此这次果断选择了datax。一个是基于对datax的了解,一个是基于要丰富自己能力(*^▽^*)。

记录:

一、datax安装部署

https://github.com/alibaba/DataX/blob/master/userGuid.md看这个官方的文档就足够了。简单说就是开箱即用。非常方便。注意:python版本 建议2.6python在3.0版本进行了语句的调整,和2.*的版本差异比较大,导致2.*的python是无法在环境是3.0的机器上运行的。下附suse或者readhat的安装python 2.7的方法:wget https://www.python.org/ftp/python/2.7.14/Python-2.7.14.tgz # Downloadtar xvfz Python-2.7.14.tgz # unzipcd Python-2.7.14 # go into directory./configuremake # buildsu # or 'sudo su' if there is no root usermake altinstall

二、mysql到mysql的数据同步

这块分两部分介绍

  1. datax的同步脚本,供学习者学习;

  2. 针对我的这个业务场景的补偿机制,供参考;

{
    "job": {
            "setting": {
             
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要在Linux上安装DataXDataX Web,您可以按照以下步骤进行操作: 1. 安装Java:DataX是基于Java开发的,所以首先需要安装Java运行环境。您可以使用以下命令来安装OpenJDK(Java的一个开源实现): ``` sudo apt update sudo apt install openjdk-8-jdk ``` 2. 下载DataX:您可以从DataX官方GitHub页面(https://github.com/alibaba/DataX)上下载DataX的最新版本。使用以下命令将其下载到您的Linux系统中: ``` wget https://github.com/alibaba/DataX/archive/refs/tags/vx.x.x.tar.gz ``` 3. 解压DataX:使用以下命令解压下载的DataX压缩包: ``` tar -zxvf vx.x.x.tar.gz ``` 4. 配置DataX:进入解压后的DataX目录,并编辑`job`目录下的配置文件`job.json`,根据您的需要配置数据源和目标源的连接信息。 5. 运行DataX:使用以下命令启动DataX并执行数据迁移任务: ``` cd DataX-x.x.x python bin/datax.py job/job.json ``` 至此,您已成功在Linux上安装和运行DataX。 如果您还希望安装DataX Web,可以按照以下步骤进行操作: 1. 安装Python和pip:DataX Web是基于Python和Flask框架开发的,所以需要安装Python和pip包管理工具。使用以下命令安装: ``` sudo apt install python3 python3-pip ``` 2. 下载DataX Web:您可以从DataX Web的官方GitHub页面(https://github.com/WeiYe-Jing/datax-web)下载最新版本。使用以下命令将其下载到您的Linux系统中: ``` wget https://github.com/WeiYe-Jing/datax-web/archive/refs/tags/vx.x.x.tar.gz ``` 3. 解压DataX Web:使用以下命令解压下载的DataX Web压缩包: ``` tar -zxvf vx.x.x.tar.gz ``` 4. 安装依赖:进入解压后的DataX Web目录,使用pip安装所需的依赖包: ``` cd datax-web-x.x.x pip3 install -r requirements.txt ``` 5. 配置DataX Web:编辑`config.py`文件,根据您的需要配置数据库连接等信息。 6. 初始化数据库:使用以下命令初始化数据库: ``` python3 manage.py db init python3 manage.py db migrate python3 manage.py db upgrade ``` 7. 启动DataX Web:使用以下命令启动DataX Web服务: ``` python3 manage.py runserver ``` 现在,您可以通过访问`http://localhost:8888`在浏览器中访问DataX Web界面,并使用DataX Web来执行和管理数据迁移任务。 希望对您有所帮助!如有其他问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值