分区的类型:
静态分区、动态分区、混合分区
静态分区:新增分区或者是加载分区数据时指定分区名
动态分区:新增分区或者是加载分区数据时,分区名未知。
混合分区:静态分区和动态分区同时存在。
思路:
动态分区的举例:
A表数据
uid uname year month day
1 zhangsan 2019 4 19
2 lissi 2019 4 18
B表是分区表,按照year month day进行分区
从A表中查询数据插入到B表
动态分区的属性:
动态分区的相关属性:
set hive.exec.dynamic.partition=true; ##允许动态分区
set hive.exec.dynamic.partition.mode=strict ##分区模式的设定nostrict:strict(非严格模式:严格模式)
严格模式:至少需要一个静态分区
非严格模式:可以全是动态分区
set hive.exec.max.dynamic.partitions ##允许动态分区的最大数量
set hive.exec.max.dynamic.partitions.pernode ##每个节点上允许的最大的动态分区的数量(也就是reducetask的数量)
创建临时表
create table if not exists tmp(
uid int,
commentid bigint,
recommentid bigint,
year int,
month int,
day int
)
row format delimited
fields terminated by