Hive分区表更改表结构

        Hive的分区表更改表结构后需要注意的是旧分区的结构(包括序列化参数)都是不会更改的,如果往旧分区里重新insert或者load数据覆盖掉原来的数据,hive去旧分区select出来的新字段仍是NULL,所以需要手动去数据库里修改hive的元数据。(基于hive-0.10,序列化参数应该是都不会变,但是在0.8.1里旧分区的结构好像也会随着表结构更改。)


        修改分区表结构

         
        hive元数据中表结构存放在COLUMNS_V2表里,这个表的主键是CD_ID和COLUMN_NAME,CD_ID和TBL_ID是一一对应的,因此只需要把每个分区对应的CD_ID替换成表的CD_ID即可,shell脚本如下:

table=$1
CD_ID=`echo "select CD_ID from SDS where SD_ID=(select SD_ID from TBLS where TBL_NAME='$table')" | mysql |grep -v 'CD_ID'`
echo $CD_ID
echo "update SDS set CD_ID=$CD_ID where SD_ID in (select SD_ID from PARTITIONS where TBL_ID=(select TBL_ID from TBLS where TBL_NAME='$table'))"|mysql 



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值