datax同步分布式mysql_基于Datax的数据同步可视化平台

一、前言

DataX阿里的开源的时候并未提供任何可视化界面,我们在使用的过程中,需要将Json配置文件放到Datax的job路径下,随着业务的增加,配置文件不方便管理和迁移并且每次执行都需要记录命令。

目前DataX只支持单机版,多节点之间的协作不能控制,我们希望存在一款有友好的可视化界面,支持定时任务,支持分布式的数据同步利器,这也是该项目的目标。

二、开发环境

平台主要用于数据同步、数据处理等等ETL操作。

平台基于阿里的开源同步工具datax3.0开发。

平台开发语言Java 8。

平台运行环境无要求。

数据库Mysql5.7。

Python2.7(支持Python3需要修改替换datax/bin下面的三个python文件,替换文件在doc/datax源码阅读笔记/datax-python3下)。

项目地址:https://github.com/WeiYe-Jing/datax-web

三、项目运行

1. 下载datax打包之后的文件或者github拉取datax代码打包,配置环境变量。

DATAX_HOME=G:\learndemo\springboot-datax\datax\bin

2. 执行datax-web/db下面的sql文件并修改application.yml数据库配置信息。

3. application.yml配置数据抽取日志文件保存路径。

etlLogDir: D:\temp\logs\datax-web\

4. idea启动 datax-admin

5. 启动成功后打开页面

http://localhost:8080/index.html#/datax/job

df998a399bc2a664f270520a5d05e1b9.png

6. 点击作业配置,创建作业

d184f481f9ef8f911b6340a3c4237112.png

7. 完成创建作业之后,点击同步任务,选择任务,点击启动

cda9034216c561872572061e541a41df.png

8. 可以点击查看日志,实时获取日志信息

b637f5a6ec8af2396cd763eece818fe4.png

四、开发计划

[x] springboot重构项目

[x] 集成swagger,方便调试

[x] 集成mybatis plus和Mysql数据库存放应用数据

[x] 网页端修改并持久化job配置的json到数据库

[x] 网页端实时查看抽取日志,类似Jenkins的日志控制台输出功能

[x] 实时查看抽取日志BUG功能修复2019-11-07

[ ] job运行记录展示,页面操作停止datax作业(开发中)

[ ] 实现datax分布式作业(开发中)

[ ] 实现datax集成定时任务(开发中)

[ ] 网页端各种读写插件模板生成,可以在页面组装使用

[ ] 实现部分写插件支持自动建表功能

[ ]

QQ交流群 776939467

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值