hiveQL
Fhd-学习笔记
这个作者很懒,什么都没留下…
展开
-
SQL-where 和 on 的区别
https://blog.csdn.net/qiqi860819/article/details/4586067https://blog.csdn.net/u013468917/article/details/61933994转载 2018-07-10 11:07:10 · 269 阅读 · 0 评论 -
Hive中order by ,sort by ,distribute by ,cluster by
1、order by 会对输入做全局排序,因此只有一个reducer,会导致当输入规模较大时,需要较长的计算时间。2、sort by不是全局排序,其在数据进入reducer前完成排序。因此,如果用sort by进行排序,并且设置mapred.reduce.tasks>1,则sort by只保证每个reducer的输出有序,不保证全局有序。即每个文件是有序的。如果reduce=1,sort ...转载 2019-05-14 13:24:01 · 653 阅读 · 0 评论