datax_web搭建

datax_web的搭建

datax的部署

  1. DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各种异构数据源之间高效的数据同步功能。

  2. 环境准备:
    JDK(1.8以上,推荐1.8)
    Python(推荐Python2.6.X)
    Apache Maven 3.x (Compile DataX)

  3. github下载地址:https://github.com/alibaba/DataX

  4. 快速搭建datax,下载时使用
    在这里插入图片描述
    下载时使用方式一
    在这里插入图片描述

  5. 下载python
    下载地址:https://www.python.org/download/releases/2.7/
    此处的python选择2.7(3的版本未尝试),下载完后安装python

  6. 解压datax的压缩包,执行bin中datax.py
    在这里插入图片描述

python datax.py

datax_web的安装部署

  1. DataX阿里的开源的时候并未提供任何可视化界面,我们在使用的过程中,需要将Json配置文件放到DataX的job路径下,随着业务的增加,配置文件不方便管理和迁移并且每次执行都需要记录命令。 目前DataX只支持单机版,多节点之间的协作不能控制,我们希望能有一款有友好的可视化界面,支持定时任务,支持分布式的数据同步利器,这也是该项目的目标。

  2. github下载地址:https://github.com/WeiYe-Jing/datax-web

  3. 将下载下来的项目导入,eclipse或者idea
    在这里插入图片描述
    如图,该项目主要分为5个部分,主要的是要启动datax-admin和datax-executor
    导入的时候可能有报错,大部分问题都是maven包没有下载全
    (建议导入之后先在项目的主目录下使用 mvn install,这样基本上所有的依赖包都会install好)
    注: 项目中存在lombok包,如果没有下载该插件,需要补全log和类中缺少的set/get方法。
    在这里插入图片描述

  4. 执行数据库文件data_web.sql
    在这里插入图片描述

  5. 修改配置文件
    (1)修改datax-admin中的数据源配置
    在这里插入图片描述
    (2)修改datax.py的地址
    在这里插入图片描述
    将路径改成之前安装的datax的目录下面(简单来说,项目启动的时候会自动执行配置中datax.py)
    先启动admin,再启动executor

  6. 下载前端项目
    gitlub地址:https://github.com/WeiYe-Jing/datax-vue-admin
    将项目导入vscode

  7. 启动前端项目

npm install
npm run dev

访问地址:http://localhost:8082/
账号:admin
密码:123456
出现如图说明部署成功

注:前端项目install可能会出现node-sass安装失败的问题
解决方案: 由于访问外网较慢,改为国内镜像,(对vue很熟悉的可忽略)先执行

npm install -g mirror-config-china --registry=http://registry.npm.taobao.org

再执行

npm install sass-loader node-sass -D
要在Linux上安装DataXDataX Web,您可以按照以下步骤进行操作: 1. 安装JavaDataX是基于Java开发的,所以首先需要安装Java运行环境。您可以使用以下命令来安装OpenJDK(Java的一个开源实现): ``` sudo apt update sudo apt install openjdk-8-jdk ``` 2. 下载DataX:您可以从DataX的官方GitHub页面(https://github.com/alibaba/DataX)上下载DataX的最新版本。使用以下命令将其下载到您的Linux系统中: ``` wget https://github.com/alibaba/DataX/archive/refs/tags/vx.x.x.tar.gz ``` 3. 解压DataX:使用以下命令解压下载的DataX压缩包: ``` tar -zxvf vx.x.x.tar.gz ``` 4. 配置DataX:进入解压后的DataX目录,并编辑`job`目录下的配置文件`job.json`,根据您的需要配置数据源和目标源的连接信息。 5. 运行DataX:使用以下命令启动DataX并执行数据迁移任务: ``` cd DataX-x.x.x python bin/datax.py job/job.json ``` 至此,您已成功在Linux上安装和运行DataX。 如果您还希望安装DataX Web,可以按照以下步骤进行操作: 1. 安装Python和pip:DataX Web是基于Python和Flask框架开发的,所以需要安装Python和pip包管理工具。使用以下命令安装: ``` sudo apt install python3 python3-pip ``` 2. 下载DataX Web:您可以从DataX Web的官方GitHub页面(https://github.com/WeiYe-Jing/datax-web)下载最新版本。使用以下命令将其下载到您的Linux系统中: ``` wget https://github.com/WeiYe-Jing/datax-web/archive/refs/tags/vx.x.x.tar.gz ``` 3. 解压DataX Web:使用以下命令解压下载的DataX Web压缩包: ``` tar -zxvf vx.x.x.tar.gz ``` 4. 安装依赖:进入解压后的DataX Web目录,使用pip安装所需的依赖包: ``` cd datax-web-x.x.x pip3 install -r requirements.txt ``` 5. 配置DataX Web:编辑`config.py`文件,根据您的需要配置数据库连接等信息。 6. 初始化数据库:使用以下命令初始化数据库: ``` python3 manage.py db init python3 manage.py db migrate python3 manage.py db upgrade ``` 7. 启动DataX Web:使用以下命令启动DataX Web服务: ``` python3 manage.py runserver ``` 现在,您可以通过访问`http://localhost:8888`在浏览器中访问DataX Web界面,并使用DataX Web来执行和管理数据迁移任务。 希望对您有所帮助!如有其他问题,请随时提问。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值