1、分区
开启动态分区
set hive.exec.dynamic.partition=turn;
设置严格模式
set hive.exec.dynamic.partition.mode=nostrict;(默认值 strict,避免全分区字段是动态,必须有至少一个分区字段是指定有值的。避免产生大量分区)
2、分桶
开启分桶
set hive.enforce.bucketing=true;
set hive.enforce.sorting=true;(开启强制排序,插数据到表中会进行强制排序,默认false;)
3、group by 数据倾斜优化
hive.group