普通表和分区表区别:有大量数据增加的需要建分区表
1.创建分表,目的 就是操作数据量大的时,crud时比较方便,可以快速定位。
hive>create table book (id bigint, name string) partitioned by (bookIndex string) row format delimited fields terminated by ' ';
2. 此时hdfs上user 下../会有一个book文件夹,此时没有数据,没有分区,还没有load数据。
3.分区表加载数据
load data local inpath 'home/a.txt' overwrite into table book partition (bookIndex='2010-08-22');
4.查询select * from book; 有数据了,hdfs上的book文件夹下面会有 一个分区bookIndex 文件夹,这个文件夹下就是a.txt。
5.修改 alter table book add partition (bookIndex='2019-03-26') ; 又添加了index, 此时hdfs 上book文件夹下有多了一个index。
6.drop 删除后 和 内表删除一样。