HIVE 中的 CASCADE关键字

“才感春来 忽而已夏🌷”

deff719e73ddf043faeda2a9f7f4b124.png

7330b308620b8314ba68cc3a72c30243.png

THE ROMANCE
OF SPRING

bc0100623de8e5a737aec5594bd8d070.png

简要解释

f5df1145d61628feab82a1cacf9e3df0.png

CASCADE的中文翻译为"级联",顾名思义就是就是与之有联系的。在针对HIVE也就是不仅变更新分区的表结构(metadata),同时也变更旧分区的表结构。

接下来我们要验证这个关键字对分区表新增字段之后有什么影响?

2243585f199d4cb54413d9df4c88190a.png

背景说明

c14f92c5d1f8ffc10a4619cb8cde1d3e.png

在生产环境中,由于用户对HIVE知识了解不深,在针对分区表时对表新增字段,没有使用cascade关键字,那么此时对于历史分区无论是使用insert into还是insert overwrite table 插入数据新增的列显示都是null值,那么如何解决?

下面是验证步骤

c71c00f7aa99a51e05a96bdd5e4e1674.png

新增测试表以及插入数据

19e4d773c23aa687cff3fd1f8189a25d.png

#创建表,以parquet存储格式存储
create table aiops.par_c(
 id int , name string,address string,oa string,ob string
)
partitioned by (day string);
 STORED AS PARQUET;


#插入数据
insert into aiops.par_c partition(day="20230709") values (1,"tom","nanjin","0a","ob");
insert into aiops.par_c partition(day="20230709") values (2,"jack","hefei1","0a","ob");

341d95b09e2e488f0bea1fd4e3dc1f32.png

对分区表新增字段

cbf9ac19bfdd089637b171f8120b2462.png

#新增loc字段
alter table aiops.par_c add columns (loc string);

此时对于历史分区数据loc列都是null

e6de3e556806c02ae3841229f245fd68.png

继续插入数据

a1acfc229281ddffdd54357420e27bce.png

#在新增字段之后分别向历史分区以及新分区插入数据
insert into aiops.par_c partition(day="20230709") values (2,"jack","hefei1","0a","ob","loc");


insert into aiops.par_c partition(day="20230710") values (5,"linda","hefei1","0a","ob","loc");
insert into aiops.par_c partition(day="20230710") values (6,"yyx","hefei1","0a","ob","loc");

此时针对历史分区day=20230709,新插入的数据loc列显示的是MULL,这明显就出现了问题。

b653dab164b95aaadbf826120dc9a33c.png

51b4d23ad5a0257ce8ae312cea9db817.png

如何解决NULL值问题?

88ec2c4f8e6840a15b010ec854af310e.png

使用CASCADE关键字

下面命令的意思是以级联的方式对aiops.par_c表的loc列重新命名为loc2

为了列名显示正式可以使用相同的方式再修改回去

ALTER TABLE aiops.par_c  CHANGE COLUMN loc loc2 string CASCADE;

再次查询,发现NULL变成了具体插入的值了,那么问题便解决了

d031247982d47028f1c718ee844c2f5d.png

5e03195d741d8c6877d720ffb4299993.png

总结

349b57bd4195dd4052c30013590849d7.png

通过比较加与不加CASCADE关键字就知道了区别了,针对分区表新增字段时不加CASCADE关键字时对于历史分区新插入的数据,那个新增的列名值都会显示为NULL反之可正常显示。

特别说明

如果想改变新增的列在某列之后使用after关键字即执行

ALTER TABLE aiops.par_c  CHANGE COLUMN loc loc2 string  after name CASCADE;

如果存储格式是parquet格式的,那么这新增的列的数据都是null,就会出现问题,如果是普通文本格式则不会出现。

parquet存储格式在这种操作之后的情况

b2d54b60d7acb5ab131a0a7e5a2d24b1.png

textfile存储格式这种操作之后的情况

15015b5313b12d1e3214f11caba217a5.png

参考链接:

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-AlterTable/PartitionProtections

cb577cd3a53344ddaad75a8026ca235e.png

点个在看你最好看

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Hive的保留关键字包括:ADD,ADMIN,AFTER,ALL,ALTER,ANALYZE,AND,ARCHIVE,ARRAY,AS,ASC,BEFORE,BETWEEN,BIGINT,BINARY,BOOLEAN,BOTH,BUCKET,BUCKETS,BY,CASCADE,CASE,CAST,CHANGE,CLUSTER,CLUSTERED,CLUSTERSTATUS,COLLECTION,COLUMN,COLUMNS,COMMENT,COMPACT,COMPACTIONS,COMPUTE,CONCATENATE,CONF,CONTINUE,CREATE,CROSS,CURRENT,CURRENT_DATE,CURRENT_TIMESTAMP,DATA,DATABASE,DATABASES,DATE,DATETIME,DAY,DBPROPERTIES,DECIMAL,DEFERRED,DEFINED,DELIMITED,DEPENDENCY,DESC,DESCRIBE,DFS,DIRECTORIES,DIRECTORY,DISABLE,DISTRIBUTE,DIV,DROP,ELSE,ENABLE,END,ESCAPED,EXCLUSIVE,EXISTS,EXPLAIN,EXPORT,EXTENDED,EXTERNAL,FAILED,FALSE,FETCH,FIELDS,FILE,FILEFORMAT,FIRST,FOLLOWING,FOR,FROM,FULL,FUNC,FUNCTION,GE,GENERATE,GET,GLOBAL,GRANT,GROUP,GROUPING,HAVING,HOLD_DDLTIME,HOUR,IDX,IF,IGNORE,IMPORT,IN,INCLUDE,INDEX,INDEXES,INNER,INPATH,INPUTDRIVER,INPUTFORMAT,INSERT,INTERSECT,INT,BIGINTO,BIGINTO,BIGINTO,BIGINTO,BIGINTO,BIGINTO,BIGINTO,BIGINTO,IOSFORMATTED,IOWRITE,KAFKA,KEYS,KILL,LARGE,LAST,LEFT,LIMIT,LINES,LIST,LOCATION,LOCK,LOCKS,LOGICAL,MAP,MAPJOIN,MAPRED,MASTER,MATCHED,MATERIALIZE,MERGE,MINUS,MINUTE,MONTH,MSCK,NATIVE,NATURAL,NO,NOT,NULL,NULLS,OF,OFFLINE,OFFSET,OLD,ON,ONLY,OPEN,OR,ORDER,OUT,OUTER,OUTPUTDRIVER,OUTPUTFORMAT,OVER,OVERWRITE,OWNER,PARTIALSCAN,PARTITION,PARTITIONED,PARTITIONS,PERCENT,PLUS,PRECEDING,PRECISION,PRESERVE,PRETTY,PRINT,PROCEDURE,PROTOSHUFFLE,PUBLIC,RAWREAD,RAWWRITE,RCFILE,READ,READONLY,READS,REBUILD,RECORDREADERCLASS,RECORDREPLACEMENTCHARACTER,RECORDWRITERCLASS,REDUCE,REGEXP,RELOAD,RENAME,REPAIR,REPLACE,REPLICATION,RESTRICT,RESUME,RETURN,RETURNS,REVOKE,RIGHT,RLIKE,ROLE,ROLES,ROLLBACK,ROLLUP,ROW,ROWS,SCHEMA,SELECT,SEQUENCEFILE,SEPARATOR,SERDE,SERDEPROPERTIES,SET,SHARED,SHOW,SHUTDOWN,SKIP,SMALLINT,SORT,SORTED,START,STATS,STATUS,STRAIGHT_JOIN,STRING,STRUCT,TABLE,TABLES,TABLESAMPLE,TBLPROPERTIES,TEMPORARY,TERMINATED,THEN,TIME,TIMESTAMP,TINYINT,TO,TOUCH,TRAILING,TRANSACTION,TTL,TUPLE,TYPE,TYPES,UNARCHIVE,UNBOUNDED,UNCACHE,UNION,UNIQUE,UNLOCK,UNSET,UNSIGNED,UPDATE,URI,USE,USER,USING,UTC,UTCTIMESTAMP,VALUE,VALUED,VALUES,VARCHAR,VIEWS,WHEN,WHERE,WHILE,WINDOW,WITH,WORK,WRITE,YEAR.

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值