Spark源码-2.3 JoinSelection

概述逻辑计划转换为物理计划SQL被解析为逻辑计划后,会被交给SessionState的executePlan方法,转换为QueryExecution:def executePlan(plan: LogicalPlan): QueryExecution = createQueryExecution(plan)QueryExecution的构造过程将LogicalPlan转换为物理计划: protected def planner = sparkSession.sessionState.plann
摘要由CSDN通过智能技术生成

概述

逻辑计划转换为物理计划

SQL被解析为逻辑计划后,会被交给SessionState的executePlan方法,转换为QueryExecution:

def executePlan(plan: LogicalPlan): QueryExecution = createQueryExecution(plan)

QueryExecution的构造过程将LogicalPlan转换为物理计划:

  protected def planner = sparkSession.sessionState.planner
  // 1
  lazy val analyzed: LogicalPlan = {
   
    SparkSession.setActiveSession(sparkSession)
    sparkSession.sessionState.analyzer.executeAndCheck(logical)
  }
  // 2
  lazy val optimizedPlan: LogicalPlan = sparkSession.sessionState.optimizer.execute(withCachedData)
  // 3
  lazy val sparkPlan: SparkPlan = {
   
    SparkSession.setActiveSession(sparkSession)
    planner.plan(ReturnAnswer(optimizedPlan)).next()
  }
  // 4
  // executedPlan should not be used to initialize any SparkPlan. It should be
  // only used for execution.
  lazy val executedPlan: SparkPlan = prepareForExecution(sparkPlan)

  /** Internal version of the RDD. Avoids copies and has no schema */
  lazy val toRdd: RDD[InternalRow] = executedPlan.execute()

第3步中SparkPlanner将逻辑计划转换为物理计划。
JoinSelection是SparkPlanner的一条策略,用于将逻辑计划中的Join执行计划转换为合适的物理Join执行计划。

第4步中对物理计划进行进一步处理。其中包括在Join物理计划与其子物理计划之间插入Exchange物理计划(由EnsureRequirements规则实现),用于执行join前小表广播(BroadcastHashJoin)、shuffle并排序(SortMergeJoin)等使得数据分布满足join物理计划执行。

Join物理计划分类

join实现方式 物理计划
BroadcastHashJoin BroadcastHashJoinExec
ShuffledHashJoin ShuffledHashJoinExec
SortMergeJoin SortMergeJoinExec
BroadcastNestedLoopJoin BroadcastNestedLoopJoinExec
CartesianProduct CartesianProductExec

选择策略

排除由hint显式指定的情况,通过表数据量、join类型、是否存在等值join条件等策略选择物理Join实现。

join类型如下

  • InnerLike
    • Inner
    • Cross
  • <
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值