shell脚本遍历循环抽取数据

# 设置抽取数据的起始日期和结束日期
start_date="2023-02-01"
end_date=$(date +%Y-%m-%d)  # 获取当前日期

# 循环遍历,以一天为单位抽取数据
while [ "$start_date" != "$end_date" ]; do
  echo "Extracting data for partition_date=${start_date} ..."
  
  # 构造 DataX Job 配置文件 myDataXJob_${start_date}.json,设置 partition_date 参数
  cat myDataXJob.json | sed "s/\"parameter\": {/\"parameter\": {\"partition_date\":\"${start_date}\",/" > myDataXJob_${start_date}.json

  # 执行 DataX Job
  python $DATAX_HOME/bin/datax.py --jvm '-Xms2g -Xmx2g' myDataXJob_${start_date}.json
  
  # 将数据加载到 Hive 表中,并按 partition_date 字段分区
  hive -e "INSERT INTO TABLE your_hive_table PARTITION (partition_date='${start_date}') SELECT * FROM your_ck_table WHERE partition_date='$start_date';"
  
  # 将 start_date 加一天
  start_date=$(date -d "$start_date + 1 day" +%Y-%m-%d)
done
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值