对应HDFS一个指定文件夹,可以缩小查询范围,提高查询效率。
1.创建分区表
分区字段为month
注意:创建分区表时,分区字段不能是表中的已有字段,否则会报错column repeated in partitioning columns;这也说明分区字段并不是表中的一列,它是一个伪列,对应HDFS中的一个分区文件夹。
2.分区里导入数据
hive (default)> load data local inpath '/opt/module/datas/emp.txt' into table emp1 partitioned(month='08');
同理可创建7月和9月分区
2.1创建二级分区
partitioned by(month string , day string)
导入数据load data