【Hive 数据倾斜总结】

   做hive语句优化经常会听到一个名词"数据倾斜",究竟什么是数据倾斜,这里有篇文章解释的挺到位.其实数据倾斜的原因就那么几种,可以通过group by 取top逐一排查,多动手,多折腾,多比较.如何解决?小表在左,大表在右;表若不大,map join;关注空值,避免倾斜;来自@数据挖掘_PHP


wKioL1NI_qbTGOpSAAqzX-ga8M8816.jpg


From:http://weibo.com/1784501333/AFiNWBQSQ?type=repost


spacer.gif