Spark sql查询执行过程

最新推荐文章于 2024-03-06 20:37:30 发布

萌面大盗mc

最新推荐文章于 2024-03-06 20:37:30 发布

阅读量803

点赞数

分类专栏： Spark 文章标签： Spark-Sql

本文链接：https://blog.csdn.net/ahjzgyxy/article/details/44570847

版权

本文详细记录了Spark SQL（1.2版本）的查询执行过程，从创建SqlContext对象开始，经sqlText解析生成逻辑执行计划，再通过Analyzer绑定与Optimizer优化，转化为PhysicalPlan并执行，最终生成SchemaRDD。虽然Spark SQL 1.3中SchemaRDD被DataFrame取代，但基本执行流程保持不变。

摘要由CSDN通过智能技术生成

简单记录一下Spark sql（1.2版本）查询执行过程：

1.创建SqlContext对象
2.调用sqlContext.sql(sqlText)方法

val rdd:SchemaRDD = sqlContext.sql(sqlText: string)
// sql()方法实际上是new出来SchemaRDD,但是先得做些其他事
new SchemaRDD(this, parseSql(sqlText))

3.调用parseSql(sql)解析sql字符串，生成逻辑执行计划 baseLogicalPlan

// 解析sql字符串
parseSql(sql) 
// 判断该sql是不是DDL语句
// 如果是DDL语句就使用DDLParser进行解析
// 否则就使用SparkSQLParser进行解析
// 结果都是返回LogicalPlan
ddlParser(sql).getOrElse(

最低0.47元/天解锁文章

萌面大盗mc

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Spark sql查询执行过程

简单记录一下Spark sql（1.2版本）查询执行过程：创建SqlContext对象调用sqlContext.sql(sqlText)方法val rdd:SchemaRDD = sqlContext.sql(sqlText: string)// sql()方法实际上是new出来SchemaRDD,但是先得做些其他事new SchemaRDD(this, parseSql(sqlText)
复制链接

扫一扫

专栏目录