left semi join和join实现子查询性能对比

实现原理

hive从 0.13 版本实现了in/exist自查询,实现方式是通过left semi join,left semi jion具体实现是在右表(子查询)中先对on的关键字做group by ,然后再做join操作

select a.*
from
(
select brand,store_id
from dw.dim_store_info_current
) a 
left semi join
(
select brand
from dw.dim_brand_business_info_current
) b 
on a.brand=b.brand

下图为explain的截图

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5bDfcZf0-1581079185868)(left_semi_join_explain.png)]

left semi join和join实现子查询性能对比

因为多了一步group by,所以当子查询的表重复记录较少的情况下,用join实现子查询性能更高

left semi join和left join区别

  • 区别一:
    left join遇到右表重复时,结果集会产生多条记录。而left semi join因为是先做group by,所以即使右表有重复数据,得到的结果集也不会重复。
  • 区别二:
    left join可以取到右表的所有字段,但是left semi join因为是先做group by,所以只能取到右表的关联字段(即group by的维度字段)
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

左林右李02

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值