Hive有分区表和分桶表这两个概念。
分区表
基本操作
Hive的分区是指将存储的数据进一步细分,相当于一个表的分目录。一个表内有多个分区表。
create table table_name (column_name column_type, ...) partitioned by (partition_column partition_type)
//例如 按天进行分区
create table dept_partition(deptno int, dname string, loc string)
partitioned by (day string)
row format delimited fields terminated by '\t';
注意:分区字段不能是表中已经存在的数据,可以将分区字段看作表的伪列。
load data时指定分区
load data inpath "/data/test.txt" into

本文介绍了Hive的分区表概念,包括基本操作如load data、查询、增加和删除分区,以及二级分区和动态分区的使用。动态分区允许根据数据列自动确定分区,而在Hive3.0中,动态分区更加便捷。
最低0.47元/天 解锁文章
1080

被折叠的 条评论
为什么被折叠?



