DataX和xxl-job的应用实践

最新推荐文章于 2024-08-20 14:18:04 发布

~鱼缸里的猫

最新推荐文章于 2024-08-20 14:18:04 发布

阅读量811

点赞数

分类专栏：后端实战文章标签： big data java 大数据 mysql 数据库

本文链接：https://blog.csdn.net/weixin_42845647/article/details/125027856

版权

由于公司业务原因，需要下线大数据平台，而在线上继续运营的服务中，存在不少BI报表数据来源于大数据平台，为了在下线大数据平台之后，仍然能够保证BI报表数据的正常输出，决定采用DataX同步业务数据表，xxl-job实现中间表和最终数据表的逻辑计算和输出：

通过DataX实现表数据同步：
- DataX简介
  
  DataX 是阿里云 DataWorks数据集成的开源版本，在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX 实现了包括 MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres、DRDS 等各种异构数据源之间高效的数据同步功能。
- 开源地址：https://github.com/alibaba/DataX
通过xxl-job实现定时SQL执行
- xxl-job简介
  
  XXL-JOB is a distributed task scheduling framework. It’s core design goal is to develop quickly and learn simple, lightweight, and easy to expand. Now, it’s already open source, and many companies use it in production environments, real “out-of-the-box”.
  
  XXL-JOB是一个分布式任务调度平台，其核心设计目标是开发迅速、学习简单、轻量级、易扩展。现已开放源代码并接入多家公司线上产品线，开箱即用。
- 开源地址：https://github.com/xuxueli/xxl-job

DataX脚本配置（以Mysql为例）

{
     
    "job": {
     
        "content": [
            {
     
                "reader": {
     
                    "name": "mysqlreader",

关注

专栏目录