hive的 group 、distribute 、sort 、cluster、order 区别
order byhive 的语法大部分从mysql中继承过来一来节约学习成本,二是对习惯了mysql语法的更易于编程,order by 便是这样移植了过来,但放在大数据这种环境下,显得可有可无了,因为处理数仓的数据量都是非常大的,如果使用order by 便是对所有数据做一次全排序,并且只开启一个reduce来排序。效率低下,消耗的资源的代价将是非常大的,所以它的适用场景是在数据量很小的情况下才...
复制链接