Spark基于内存运算, 是MapReduce的下一代替换计算框架, 主要包含Spark-Core、Spark-SQL、Spark-Streaming、Spark-ML.
本系列只介绍Spark-Core和Spark-SQL的内核机制.
本系列分以下几篇文章.
1、Spark的任务提交流程(Spark-Core和Spark-SQL通用)
2、Spark-Core的阶段划分, 以及任务执行
3、Spark-SQL的Shuffle介绍
Spark基于内存运算, 是MapReduce的下一代替换计算框架, 主要包含Spark-Core、Spark-SQL、Spark-Streaming、Spark-ML.
本系列只介绍Spark-Core和Spark-SQL的内核机制.
本系列分以下几篇文章.
1、Spark的任务提交流程(Spark-Core和Spark-SQL通用)
2、Spark-Core的阶段划分, 以及任务执行
3、Spark-SQL的Shuffle介绍