hive表数据迁移(生产集群->测试集群)

12 篇文章 0 订阅
11 篇文章 0 订阅

由于需要在测试环境测试hive表逻辑,但是测试集群没有相关表及数据,
所以采用最简单的方式:通过hue从生产集群下载文件,然后通过hue上传到测试集群
但是。。
hive表是分区的而且每个分区下面都N多个小文件,于是编写shell脚本:

#! /bin/bash

mkdir -p ./tmp/table
rssc_array=("201901" "201902" "201903" "201904" "201905")

for i in ${rssc_array[*]}
do
     hdfs dfs -get /user/hive/table/partition_brand=vw/partition_date=$i  ./tmp/table/
done
zip -r twdwv1.zip ./tmp/table/
hdfs dfs -put twdwv1.zip  /user/asmp/sql/
rm -rf ./tmp/table
echo "File successfully deleted"

for i in ${rssc_array[*]}
do
     hdfs dfs -get /user/hive/table/partition_brand=skd/partition_date=$i  ./tmp/table/
done
zip -r twdskd1.zip ./tmp/table/
hdfs dfs -put twdskd1.zip  /user/asmp/sql/
rm -rf ./tmp/wd_tt_workitem_detail
rm -f twdskd1.zip
echo "File successfully deleted2"

(1)根据品牌分区,下载成两个压缩文件,并上传到HDFS
(2)根据数组自定义下载不同日期的文件
然后通过hue把压缩文件下载到本地,解压后上传到测试集群
最后别忘记使用msck命令修复表分区结构:
hive> msck repair table table_name;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值