Presto 之Semi Join的实现

一. 前言

       在Presto中,select xxx from xxx where xxx in (select xxx from xx) 这种形式的SQL会被转成成Semi Join执行,通过xxx与子查询Join并且保留xxx的值实现in的过滤功能。本文主要介绍Semi Join在Presto中是如何实现的。

二. Semi Join的实现

        其实在Presto中,Semi Join的实现原理还是很简单的,本章以select * from t1 where id not in (select * from t2) 为例介绍Semi Join的实现过程。

  1. Presto先把select * from t2的子查询编译成SetBuilderOperator算子:

                  

 

      2. 先执行子查询,子查询所有的数据完成输入后,SetBuilderOperator的channelSetFuture会被设置为Done状态,并且将子查询的结果保存在channelSetFuture中:

 

      3. channelSetFuture 完成后,HashSemiJoinOperator便开始接收数据:

 

       4.  HashSemiJoinOperator一边接收数据,一般判断Join列的数据是否在channelSet中存在,然后将存在的状态在输出Page中保存成新的一列:

   

     5.   HashSemiJoinOperator的输出再传给FilterAndProjectOperator,FilterAndProjectOperator 根据4中新增加的Bool列为true or false将数据过滤或者保留:

    如上就是在Presto中Semi Join的实现过程。 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Presto SQL中的CROSS JOIN是一种用于获取两个表的笛卡尔积的操作。它会将左表的每一行与右表的每一行进行组合,生成一个新的表。CROSS JOIN操作没有任何条件约束,它会返回两个表中所有可能的组合。 在Presto SQL中,可以使用CROSS JOIN关键字来执行CROSS JOIN操作。例如,如果我们有两个表A和B,可以使用以下语法执行CROSS JOIN操作: SELECT * FROM A CROSS JOIN B; 这将返回一个新的表,其中包含A表和B表中所有可能的组合。请注意,CROSS JOIN操作可能会导致结果集非常庞大,因此使用时需要谨慎。 引用中的列转行示例中,通过使用UNION ALL将htable表的不同列转换为多行,每一行包含一个uid、一个key和一个value。 引用中的行转列示例中,通过使用map_agg函数将htable表的多行聚合为一行,每一行包含一个uid和一个包含c1、c2和c3列的键值对映射。 引用中的行转列示例中,通过使用CASE WHEN语句,将htable表的多行转换为一行,每一行包含一个uid和一个包含c1、c2和c3列的键值对映射,其中使用max函数将每个列的值聚合到一起。 总结起来,Presto SQL中的CROSS JOIN操作可以用于获取两个表的笛卡尔积。同时,可以使用列转行和行转列的方法来处理表中的数据,根据具体的需求选择合适的方法进行数据转换。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Hive/Spark/Presto/标准SQL实现行转列和列转行](https://blog.csdn.net/soaring0121/article/details/99870447)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值