hql优化（持续更新）

最新推荐文章于 2022-07-08 23:54:17 发布

wangfutai91

最新推荐文章于 2022-07-08 23:54:17 发布

阅读量1.6k

点赞数

分类专栏： hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/suojie123/article/details/86479267

版权

hive 专栏收录该内容

25 篇文章 1 订阅

订阅专栏

join的优化

hive假定查询中的最后一个表是最大的表，在每次进行连接操作时，其会将其他表缓存起来，然后扫描最后那个进行计算，所有需要保证连续查找中表的大小按照从左到右依次增加。

或者，使用 /*+STREAMTABLE(大表别名)*/，最大的表可以不放到最后面。

注意，此处和关系型数据库的区别：

关系型数据库优化时，选择最有效率的表名顺序<查两张以上表时，把记录少的放在右边>：

ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名，FROM子句中写在最后的表(基础表 driving table)将被最先处理，在FROM子句中包含多个表的情况下,你必须选择记录条数最少的表作为基础表。如果有3个以上的表连接查询, 那就需要选择交叉表(intersection table)作为基础表, 交叉表是指那个被其他表所引用的表.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hql优化（持续更新）

join的优化hive假定查询中的最后一个表是最大的表，在每次进行连接操作时，其会将其他表缓存起来，然后扫描最后那个进行计算，所有需要保证连续查找中表的大小按照从左到右依次增加。或者，使用 /*+STREAMTABLE(大表别名)*/，最大的表可以不放到最后面。注意，此处和关系型数据库的区别：关系型数据库优化时，选择最有效率的表名顺序&lt;查两张以上表时，把记录少的放在右边&gt...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。