【Hive 数据倾斜总结】
做hive语句优化经常会听到一个名词"数据倾斜",究竟什么是数据倾斜,这里有篇文章解释的挺到位.其实数据倾斜的原因就那么几种,可以通过group by 取top逐一排查,多动手,多折腾,多比较.如何解决?小表在左,大表在右;表若不大,map join;关注空值,避免倾斜;来自@数据挖掘_PHP
From:http://weibo.com/1784501333/AFiNWBQSQ?type=repost
转载于:https://blog.51cto.com/dwf07223/1394677