Hive : SORT BY vs ORDER BY vs DISTRIBUTE BY vs CLUSTER BY
在Apache Hive中,像SQL一样,您可以根据全局排序和分布要求决定对数据进行全局排序或局部排序。在这篇文章中,我们将了解Hive中的SORT BY,ORDER BY,DISTRIBUTE BY和CLUSTER BY的含义。sort bysort by不是全局排序,其在数据进入reducer前完成排序,因此,如果用sort by进行排序,并且设置mapred.reduce.tasks&g...
原创
2019-04-08 15:49:31 ·
262 阅读 ·
0 评论