Hive分桶表&分区表

本文介绍了Hive中的分区表和分桶表概念,包括如何创建、加载和查询数据,以及动态分区的配置与调整。通过分区表解决Hive无索引问题,采用分桶提高查询效率。详细讲解了二级分区的使用,并列出不同添加、删除分区的方法。
摘要由CSDN通过智能技术生成

Hive分桶表&分区表

分区表

Hive存在的问题:hive中没有索引机制,每次查询的时候,hive会暴力扫描整张表.MySQL具有索引机制.

因为没有分区,所以hive搞了一个分区表的机制.在建表的时候,加上分区字段,然后会在表的目录下建立一个个的分区.如果按照天为分区,那么在表目录里就会有每天的目录.分区表的核心就是分目录.

分区表的建表

create table dept_partition(
deptno int, dname string, loc string
)
partitioned by (day string)
row format delimited fields terminated by '\t';

​ 上面的语法中分区字段不能和分区表中的内容一样

分区表的加载:加载数据的时候要把分区字段名给指定

load data local inpath '/opt/module/hive/datas/dept_20200401.log' into table dept_partition partition(day='20200401');

分区表的查询

​ 查询一个分区的方式:

select * from dept_partition where day = '20200401'

​ 查询多个分区的方式一:

select * from dept_partition where day = '20200401' or day = '20200402';

​ 方式二:

select * from dept_partition where day = '20200401' 
union
select * from dept_partition where day = '20200402'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值