hive的select查询

最新推荐文章于 2024-05-14 14:39:26 发布

freefish_yzx

最新推荐文章于 2024-05-14 14:39:26 发布

阅读量433

点赞数

文章标签： hive hive select

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/freefish_yzx/article/details/77181559

版权

hive的select查询分为基础查询和连接查询

select基础查询

1、order by
全局排序

2、sort by
局部排序 : 每一个结果文件有序，每一个reduceTask有一个结果文件

3、distribute by
分桶：只分桶，不排序，如果需要排序请加上sort by
分桶的原理：按照分桶的字段的值的hash去模除以桶的个数来决定该条记录在哪个桶中
分桶的作用：主要是用来提高join查询的效率

4、cluster by
分桶：又分桶，又排序
case1 : 当 distribute by 字段和 sort by 后的字段一致时，可以直接使用cluster by
distribute by age sort by age = cluster by age;
case2 ：当sort by还需要根据其他字段排序时，也就是说 cluster by和 sort by要进行共用的时候，这是不允许的
cluster by age sort by id XXXXXXXXXXX
替代写法;
distribute by age sort age,id

总结一个规律：创建表的时候都有ed，查询的时候都没有

hive的join查询：http://blog.csdn.net/freefish_yzx/article/details/77166906

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。