Hive 循环插数脚本

说明

当前有一个日期分区表,分区字段为 ds ,我们需要通过循环每天日期实现把一段日期的数据插入另外一张表中,建表语句如下:

-- 建表语句
CREATE TABLE crm_user_info (
  cust_no         string COMMENT '客户编号',
  cust_name       string COMMENT '客户姓名',
  gender          string COMMENT '客户性别',
) COMMENT '客户信息表'
partitioned by (ds string)
stored as orc tblproperties ('orc.compress'='SNAPPY')
;

注意:此处可以通过查询分区的方式将多个分区一次性插入,该种方式仅为演示该脚本的实现

#!/bin/sh

begin_date=20211014
end_date=20220131

# shellcheck disable=SC2034
this_script_name=${0##*/}

exitCodeCheck() {
    if [ $1 -gt 0 ]; then
        echo '${this_script_name} fail exit_code=$1,reason: $2'
        exit $1
    else
        echo 'shell execute success'
    fi
}

# shellcheck disable=SC2034
for i in `seq 1 300`; do
  # shellcheck disable=SC2039
  if [[ ${begin_date} -gt ${end_date} ]]; then
    break
  fi
  echo "start run ${begin_date}"
  hive -e "
  INSERT OVERWRITE TABLE crm_user_info_temp partition(ds = '${begin_date}')
  SELECT * 
  FROM crm_user_info 
  WHERE ds = '${begin_date}'
  "
  result=$?
  exitCodeCheck $result
  begin_date=$(date -d "${begin_date} +1 day" +%Y%m%d)
done

echo ">>>>>>>>>>>>>>> Done at `date +"%F %H:%M:%S"` <<<<<<<<<<<<<<<"

exit 0
  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值