【Hive创建静态分区表】

前言

当数据量过大时,为了避免查询时扫描表的全部数据,Hive支持根据指定的字段对表进行分区,分区的字段可以是日期、地域、种类等具有标识意义的字段。

在建表语句中,使用PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)来规定分区。但需要注意分区字段不能是表中已经存在的字段

加载分区数据

分区的属性是由用户在加载数据的时候手动指定的。

load data [local] inpath 'filepath' into table tablename partition(分区字段='分区值');

local参数用于指定待加载的数据是位于本地文件系统还是HDFS文件系统。

使用

当建立好分区表后,即可指定分区字段来减少查询扫描的数据量。

select count(*) from teacher_student_part where role = 'student' and gender = '女'
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值