一、数据准备
create database if not exists myhive;
use myhive;
drop table if exists student;
create table student(
stuid int,
stuname string,
stuage int,
department string
)
row format delitmited fields terminated by ' ' ;
select * from student;
student.txt 内容如下:
1 tokgo 33 AA
2 chirs 44 CC
3 lucy 55 BB
4 tom 66 DD
5 jack 77 AA
6 john 44 BB
7 alis 77 CC
8 tony 33 CC
9 lelisy 99 DD
10 chery 88 AA
二、分区
hive表就是hdfs的上的一个目录
hive表中的数据,其实就是对应了HDFS上的一个目录下的数据
概念:对hive表的数据做分区管理
创建分区表
create table student_ptn(stuid int,stuname string)
partitioned by(stuage int,department string)
row format delimited fields terminated by ' ';
添加分区
// 添加一个分区
alter table student_ptn add partition(stuage=33,department="CC");
// 同时添加多个分区
alter table student_ptn add partition(stuage&