Spark
Spark架构、实现原理、实战、源码
123 黑曼巴
黑曼巴
展开
-
spark任务提交流程源码分析
我这里使用spark2.4.4版本;1.入口脚本与入口类进入org.apache.spark.deploy.SparkSubmit类的main方法override def main(args: Array[String]): Unit = { val submit = new SparkSubmit() { self => override protected def parseArguments(args: Array[String]): SparkSubm原创 2021-08-02 23:49:44 · 174 阅读 · 0 评论 -
spark的DAGScheduler
/** * The high-level scheduling layer that implements stage-oriented scheduling. It computes a DAG of * stages for each job, keeps track of which RDDs and stage outputs are materialized, and finds a * minimal schedule to run the job. It then submits sta原创 2021-07-04 23:25:31 · 169 阅读 · 3 评论 -
spark的shuffle详解
待完善原创 2021-07-04 13:59:05 · 158 阅读 · 0 评论 -
spark的org.apache.spark.deploy.SparkSubmit类
待完善原创 2021-07-03 21:58:09 · 403 阅读 · 1 评论 -
spark数据本地性级别划分
待完善原创 2021-07-02 22:09:25 · 607 阅读 · 2 评论 -
Spark Launcher Java API提交Spark算法
在介绍之前,我先附上spark 官方文档地址:http://spark.apache.org/docs/latest/api/java/org/apache/spark/launcher/package-summary.html源码github地址:https://github.com/yyijun/framework/tree/master/framework-spark1.主要提交参数说明 spark-submit \ --master yarn \ --...原创 2020-06-07 12:36:06 · 9885 阅读 · 1 评论
分享