hive 分区表select全部数据_【Hive教程】(六)HIVE分区表 (静态分区+动态分区)

分区表

分区表在实际企业中用途非常广,首先一个案例体验一下分区表的作用:

假设我每天都要往HIVE表中插入一万条数据。经过一年的时间,我里面已经有365万条数据。

现在我需要查询某个日期的数据,我select * from tablename where data=”20180101″,那么hive一般会扫描整个表内容,会消耗很多时间。如果引入partition概念。以日期作为分区字段,相同日期的数据在同一个分区,要查询某个日期的数据,直接就定位某个分区了,就非常快。

Hive分区是在创建表的时候用Partitioned by 关键字定义的,可以定义多个分区。

hive (default)> create table partition_table(id int,age int,name string)partitioned by(sex string,data string) row format delimited fields terminated by ':';

分区表加载数据:

[root@master home]# cat partition.txt

1:12:q

2:13:a

3:14:z

[root@master home]# cat partition1.txt

4:15:w

5:16:s

load数据的时候直接指定分区,那么所有数据都会自动加上相对应的分区列。

hive (default)> load data local inpath '/home/partition.txt' into table partition_table partition(sex='man'

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值