*本片只是为了唤醒我的记忆,如果想看运行结果请参考hive的分区表概念以及修改操作
分区表是什么
Hive的分区表就是HDFS上的一个独立的文件夹,这个文件夹下是这个分区所有的数据。
为什么要使用分区表
HIve的分区就是一个分目录,在查询的时候使用WHERE自居选择需要查询的分区,查询效率会提高很多。
分区表的基本操作
- 创建分区表
create table table_name(deptno int, dname string, loc string) partitioned by (month String) row format delimited fields terminated by '\t'
- 加载数据到分区表中
load data local inpath'path' into table table_name partition(month='202107');
- 查询分区表中的数据
select * from table_name where month='202107';
- 多分区联合查询可以使用关键字union
select * from table_name where month='202107'
union
select * form table_name where month='202108'
- 增加一个或多个分区
alter table table_name add partition(month='2022109'), partition(month='202110')
- 删除一个或多个分区
alter table table_name drop partition(month='202110'), partition(month='202109')
- 查看该分区表有多少个分区
show partitions table_name
- 查看分区表的信息
desc formatted table_name
- 重命名表
alter table name rename to new_name