order by : 全局排序,一个reduce中完成
sort by : 分区排序,多个reduce中分别完成
distribute by : 将相同字段的map输出分发到一个reduce节点上做处理
cluster by :合并sort by 和distribute by 功能。
hive的order by ,sort by ,distribute by 和 cluster by
最新推荐文章于 2024-04-29 20:15:18 发布
order by : 全局排序,一个reduce中完成
sort by : 分区排序,多个reduce中分别完成
distribute by : 将相同字段的map输出分发到一个reduce节点上做处理
cluster by :合并sort by 和distribute by 功能。