datax离线同步oracle表到clickhouse实践2

本文详细介绍了如何在Oracle19c数据库和ClickHouse中安装容器,使用DataX工具进行全量和增量数据同步,以及编写shell脚本自动化定时任务的过程。
摘要由CSDN通过智能技术生成

时间:2024.01

目录
1、安装启动 oracle19c 容器
2、rpm包安装clickhouse
3、datax安装
4、datax同步
目标库根据要同步的表,按照clickhouse建表规范建表
编写json文件
编写增量同步shell脚本,加入 crond 定时任务

接上一篇
tar -zxvf datax_ck.tar.gz -C /root/


1、把历史数据 20240201 之前的数据一次性同步到 clickhouse
cd /root/datax/bin
mkdir -p tables/test01
cd tables/test01

vim test.json
{
  "job": {
    "content": [
      {
        "reader": {                    
          "name": "oraclereader",                    
          "parameter": {                        
            "connection": [ {                                
              "jdbcUrl": ["jdbc:oracle:thin:@192.168.15.6:11521:ORCLPDB1"],          
              "querySql": ["select * from TDBA_TEST01 WHERE to_char(create_date,'yyyymmdd')<='20240201'"]}
            ],                       
          "username": "bigdata",
          "password": "bigdata"                        
          }                
        },
        "writer": {
          "name": "clickhousewriter",
          "parameter": {
            "username": "default",
            "password": "bigdata",
            "column":["*"],
            "connection": [
              {
                "jdbcUrl": "jdbc:clickhouse://192.168.15.7:8123/default",
                "table":["TEST01"]
              }
            ]
          }
        }
      }
    ],
    "setting": {
      "speed": {
        "channel":1 
      }
    }
  }
}

手动执行同步
cd /root/datax/bin
./datax.py tables/test01/test.json


2、同步增量数据

cd /root/datax/bin/tables/test01/

vim test01.json
{
  "job": {
    "content": [
      {
        "reader": {                    
          "name": "oraclereader",                    
          "parameter": {                        
            "connection": [ {                                
              "jdbcUrl": ["jdbc:oracle:thin:@192.168.15.6:11521:ORCLPDB1"],          
              "querySql": ["select * from TDBA_TEST01 WHERE to_char(create_date,'yyyymmdd')='20240202'"]}
            ],                       
          "username": "bigdata",
          "password": "bigdata"                        
          }                
        },
        "writer": {
          "name": "clickhousewriter",
          "parameter": {
            "username": "default",
            "password": "bigdata",
            "column":["*"],
            "connection": [
              {
                "jdbcUrl": "jdbc:clickhouse://192.168.15.7:8123/default",
                "table":["TEST01"]
              }
            ]
          }
        }
      }
    ],
    "setting": {
      "speed": {
        "channel":1 
      }
    }
  }
}

注:json文件只是修改了sql的条件,其他没有变化。


编写shell脚本

test01.sh
#!/bin/bash
echo $PATH
PATH=/etl/jdk1.8.0_201/bin:$PATH
echo $PATH
etl_date=$(date -d "`date +%Y%m%d` -3 day" +%Y%m%d)
sed "s/20240202/$etl_date/" /root/datax/bin/tables/test01.json >/root/datax/bin/tables/test01_final.json
/root/datax/bin/datax.py /root/datax/bin/tables/test01_final.json >>/root/datax/bin/test01_final.log


加入到定时任务(分时天月周),每天6点执行
[root@docker bin]# crontab -e
0 6 * * * /root/datax/bin/tables/test01/test01.sh > ~/crontab.log

注:$PATH 环境变量信息,重定向到 crontab.log,方便调试
 

  • 5
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值