数据倾斜场景:少数key的数据量过于集中: 由于聚合函数的操作造成jion类的倾斜 处理倾斜: 提前将倾斜的数据处理掉提高并行度,多分区多task对Group的聚合分段聚合局部整合对key随机打散将reduce端的聚合提前到map端