Hive 默认分区的测试

文章展示了在Hive中创建和管理分区表的过程,包括插入数据到指定和未指定分区的情况。当不指定分区时,数据会被插入到__HIVE_DEFAULT_PARTITION__中。无论分区类型是整数还是字符串,不指定分区插入的结果相同,都会产生一个默认分区,并可在查询时选择检索默认分区的数据。
摘要由CSDN通过智能技术生成

1.分区类型非字符串型

1.1 创建分区表 tp

create table tp(c1 string) partitioned by (pc int) stored as textfile;

1.2 往 pc=1分区插入一条数据。

insert into tp (c1,pc)values('1',1);

1.3 往 pc=2分区插入一条数据。

insert into tp (c1,pc)values('2',2);

1.4 显示当前分区

两个分区

hive> show partitions tp;
OK
pc=1
pc=2

1.5 插入数据,不指定分区

insert into tp (c1)values('3');

1.6 显示当前分区

三个分区,多了一个分区 pc=__HIVE_DEFAULT_PARTITION__

hive> show partitions tp;
OK
pc=__HIVE_DEFAULT_PARTITION__
pc=1
pc=2

1.7 仅检索默认分区的数据

hive> select * from tp where pc is NULL;
OK
3	NULL

2.分区类型字符串型

2.1 创建分区表 tp_str

create table tp_str(c1 string) partitioned by (pc string) stored as textfile;

2.2 往 pc=1分区插入一条数据。

insert into tp_str (c1,pc)values('1','1');

2.3 往 pc=2分区插入一条数据。

insert into tp_str (c1,pc)values('2','2');

2.4 显示当前分区

两个分区

hive> show partitions tp_str;
OK
pc=1
pc=2

2.5 插入数据,不指定分区

insert into tp_str (c1)values('3');

2.6 显示当前分区

三个分区,多了一个分区 pc=__HIVE_DEFAULT_PARTITION__

hive> show partitions tp_str;
OK
pc=__HIVE_DEFAULT_PARTITION__
pc=1
pc=2

2.7 仅检索默认分区的数据

hive> select * from tp_str where pc='__HIVE_DEFAULT_PARTITION__';
OK
3	__HIVE_DEFAULT_PARTITION__
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值