hive在建表的时候可以建分区表
分区主要用于提高性能
分区列的值将表划分为一个个的文件夹
查询时语法使用"分区"列和常规列类似
查询时Hive会只从指定分区查询数据,提高查询效率
分区又分为动态分区和静态分区
首先,我们建一个普通的外部表,导入一个拥有4列字段的文件数据,我们拿这一个表来演示动态分区和静态分区
create external table obs_users(
userid string,
username string,
birthday string,
sex string
)
row format delimited fields terminated by ‘,’
location ‘/wh’;
展示一下数据:

静态分区
下面来建一个分区表:
create table userinfos(
userid string,
username string,
birthday string
)
partitioned by (sex string)
row form

最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



