Spark 2.2.0 SQL的运行过程(源码解密)

本文详细介绍了Spark SQL 2.2.0的执行过程,从SQL解析到生成Physical Plan,再到执行RDD。解析过程涉及SQL词法语法解析、Analyzer、Logical Plan优化、Physical Plan生成。文章还深入探讨了Analyzer、SessionState、Catalog和SparkPlanner的角色,以及优化器和执行计划的细节。
摘要由CSDN通过智能技术生成

1、     Spark SQL的运行过程

接下来我们看一下Spark SQL的运行过程,Spark  SQL 的运行架构如图 27- 2所示:


图 27- 2 SQL 的运行架构

通过初步解析不同来源的数据变为UnresolvedLogical Plan(此过程会提取关键字,检查基本的语法,如果有问题下一步直接不能运行),进一步解析语法树生成Logical Plan,进行CombineFilters,CombineLimits等优化策略-,产生Physical Plan,把需要执行的操作转换为spark可以真正执行的RDD。

先概括一下,其执行流程是:

Parse SQL -> Analyze Logical Plan -> OptimizeLogical Plan -&g

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

段智华

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值