[1020]hive中分区表的创建

最新推荐文章于 2024-05-10 07:38:43 发布

周小董

最新推荐文章于 2024-05-10 07:38:43 发布

阅读量7k

点赞数 2

分类专栏：大数据

原文链接：https://blog.csdn.net/dwt1415403329/article/details/99204552

版权

大数据专栏收录该内容

22 篇文章 3 订阅

订阅专栏

1、开启分区

set hive.exec.dynamic.partition=true; 
 
set hive.exec.dynamic.partition.mode=nonstrict;

否则会出抛出异常：

2、创建分区表

创建静态分区表：

create table test_part_table(
word string,
num bigint 
)partitioned by(dt string)
row format delimited fields terminated by '\t';
 
--添加分区
alter table test_part_table add if not exists partition(dt='20190808') location '20190808';
 
--插入数据
load data local INPATH '/home/dongwentao15/dataTest/test1' overwrite into table test_part_table PARTITION (dt='20190811');
 
 
hive (dongwentao15)> select * from test_part_table;
OK
dwt     22      20190811
cn      3       20190811
un      1       20190811
fk      5       20190811
pl      19      20190811
6       NULL    20190811

第二步骤的添加分区可以省略，可以直接load数据到分区表中，在load数据的过程中，hive会自动创建分区目录。

创建动态分区表：

create table orders_part(
order_id string,
user_id string,
eval_set string,
order_number string,
order_hour_of_day string,
days_since_prior_order string
)partitioned by(order_dow string)
row format delimited fields terminated by ',';
 
--添加数据
insert into table orders_part partition (order_dow) select order_id,user_id,eval_set,order_number,order_hour_of_day,days_since_prior_order,order_dow from orders;
 
其中orders表中的字段是：
order_id,user_id,eval_set,order_number,order_dow,order_hour_of_day,days_since_prior_order

需要注意的是：动态添加分区的时候，查询的分区字段必须放在最后面(order_dow)，否则结果不是你想要的；

insert…select 往表中导入数据时，查询的字段个数必须和目标的字段个数相同，不能多，也不能少,否则会报错。但是如果字段的类型不一致的话，则会使用null值填充，不会报错。而使用load data形式往hive表中装载数据时，则不会检查。如果字段多了则会丢弃，少了则会null值填充。同样如果字段类型不一致，也是使用null值填充。

来源：https://blog.csdn.net/dwt1415403329/article/details/99204552

周小董

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
[1020]hive中分区表的创建

1、开启分区set hive.exec.dynamic.partition=true; set hive.exec.dynamic.partition.mode=nonstrict;否则会出抛出异常：2、创建分区表创建静态分区表：create table test_part_table(word string,num bigint )partitioned by(dt string)row format delimited fields terminated by '\t';
复制链接

扫一扫

专栏目录