将hive三级分区表中指定某一级分区的数据,全部导入一张新表的操作

需求场景:hive原始表tbl1,三级分区分别是dt、hour、proj_id,现在要求将dt=‘20180305’下的所有数据导入一张新表tbl2

操作如下:

一、创建新表tbl2

create table tbl2 like tbl1;

二、开启动态分区,指定资源队列

set mapreduce.job.queuename=root.offline.hdp_teu_dpd.normal;
set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;
set hive.exec.max.dynamic.partitions.pernode=6000;
set hive.exec.max.dynamic.partitions=60000;

三、将旧表数据导入新表(动态分区,查tbl1最后三个字段,即三个分区字段,会自动作为tbl2的分区字段)

insert overwrite table tbl2 partition(dt,hour,proj_id) select * from tbl1 where dt='20180305' and hour='01' and proj_id='3289916654594';

ps:要求导入dt='20180305'和proj_id='3289916654594',然后hour='00'~'19'的数据,写一个执行脚本即可

#!/bin/bash

for((hour='00';hour<='19';hour++))
do

hive -e 
"insert overwrite table tbl2 partition(dt,hour,proj_id) select * from tbl1 where dt='20180305' and hour=$hour and proj_id='3289916654594';"

done

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值