Hive 的分区详解

本文介绍了Hive的分区管理,包括数据准备、创建分区表、添加、查询、修改和删除分区的方法。提到了数据导入的三种方式:hadoop fs、load和insert ... select...,并指出动态分区能根据字段值创建多个分区,每个分区存储相应字段值的所有数据。
摘要由CSDN通过智能技术生成

一、数据准备

create database if not exists myhive;
use myhive;
drop table if exists student;
create table student(
    stuid int,
    stuname string,
    stuage int,
    department string
)
row format delitmited fields terminated by ' ' ;
select * from student;

student.txt 内容如下:

1 tokgo 33 AA
2 chirs 44 CC
3 lucy 55 BB
4 tom 66 DD
5 jack 77 AA
6 john 44 BB
7 alis 77 CC
8 tony 33 CC
9 lelisy 99 DD
10 chery 88 AA

二、分区

hive表就是hdfs的上的一个目录
hive表中的数据,其实就是对应了HDFS上的一个目录下的数据
概念:对hive表的数据做分区管理

创建分区表

create table student_ptn(stuid int,stuname string)
partitioned by(stuage int,department string)
row format delimited fields terminated by ' ';

添加分区

// 添加一个分区
alter table student_ptn add partition(stuage=33,department="CC");
// 同时添加多个分区
alter table student_ptn add partition(stuage&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值