Hive中CASCADE关键字的作用

CASCADE的中文翻译为"级联"。也就是在针对HIVE不仅变更新分区的表结构(metadata),同时也变更旧分区的表结构。

在针对分区表时对表新增字段,没有使用cascade关键字,那么此时对于历史分区无论是使用insert into还是insert overwrite table 插入数据新增的列显示都是null值。

#创建表,以parquet存储格式存储
create table CASCADE_TEST.par_c(
id int , 
name string,
address string,
oa string,
ob string
)
partitioned by (day string);
 STORED AS PARQUET;
 
 
#插入数据
insert into CASCADE_TEST.par_c partition(day="20230709") values (1,"tom","nanjin","0a","ob");
insert into CASCADE_TEST.par_c partition(day="20230709") values (2,"jack","hefei1","0a","ob");

Parquet 是一种列式存储格式,被广泛应用于大数据处理平台,如 Hive、Impala 和 Spark 等。在 Hive 中使用 Parquet 格式可以提供高性能的查询和压缩,能够节省存储空间并提高查询效率

此时针对历史分区day=20230709,新插入的数据loc列显示的是NULL,这明显就出现了问题。

使用CASCADE关键字

下面命令的意思是以级联的方式对CASCADE_TEST.par_c表的loc列重新命名为loc2

为了列名显示正式可以使用相同的方式再修改回去

ALTER TABLE CASCADE_TEST.par_c  CHANGE COLUMN loc loc2 string CASCADE;

再次查询,发现NULL变成了具体插入的值了,那么问题便解决了

特别说明

如果想改变新增的列在某列之后使用after关键字即执行

ALTER TABLE CASCADE_TEST.par_c  CHANGE COLUMN loc loc2 string  after name CASCADE;

如果存储格式是parquet格式的,那么这新增的列的数据都是null.

如果是普通文本格式则不会出现。

textfile存储格式这种操作之后的情况:

来源于:

HIVE 中的 CASCADE关键字-CSDN博客

  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值