资源充足下开启并发:
set hive.exec.parallel=true;
set hive.exec.parallel.thread.number=160; 这个数字按需设置
如果数据倾斜可以加这两个参数:
set hive.groupby.skewinda =true;
set hive.optimize.skewjoin =true;
作业map数量多可以提高每个map处理文件大小,默认是128M
set mapred.max.split.size=1024000000;
set mapred.min.split.size=102400000;