Hive中备份分区表

1.写在前面

转岗大数据,接手旧项目有新需求,虽然ods层表是全量采集的不过为了稳妥起见备份原始ods层的表

2.备份分区表

        2.1 备份sql如下,旧表名是old,先like完全复制原表结果生成bak后缀的备份表

create table if not exists old_bak like old

        2.2 like说明:

用like 而不是as select。like虽然只能复制表结构不能带数据,但是可以完全复制表结构(包括分区),备份数据后所占空间和原表差不多。
as select 备份表可以复制表结构和数据,语法简单。缺点是备份表的分区字段会变成普通列,且无法复制表字段的comment备注信息。由于分区字段变为普通列会导致表占用空间膨胀,可能是源分区表的十几倍。

        2.3. 看看源表分区字段(没有可以跳过,下面insert语句里的partiton()就不用写了),我这里只有一个叫 partition_column_name名字的分区。

show partitions kpi

        2.4.插入源表数据到备份表中

insert into old_bak partition(partition_column_name) select * from old

完成~select 看看记录数和重要字段,备份表和原表一致

3.特殊处理

从备份表导入数据到新表时,新表字段多于旧表字段时:

备份旧表完毕后,新建的新表的字段数多余旧表的字段数,这时候将旧表数据导入到新表时,新表多余的字段一般是手动加逻辑,顺序别搞错了!hive数据是以文件形式存储,最优方法是表备份后删除重建为最佳。如下sql执行后库并不一定有数据

insert into table newTable partition(partition_column_name=‘1’) select old1,old2,current_data as newColumn

  • 9
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值