spark源码解读

  • SparkContext初始化操作

  1. private val creationSite: CallSite = Utils.getCallSite()
  2. private[spark] val listenerBus = new LiveListenerBus(this)
  3. addedFiles/addedJars:用于存储每个静态文件/ jar的URL以及文件的本地时间戳
  4. val sparkUser = Utils.getCurrentUserName()
  5. try{
    1. _conf
    2. _jars/_files/_eventLogDir/_eventLogCodec
    3. _jobProgressListener = new JobProgressListener(_conf)
    4.  _env = createSparkEnv(_conf, isLocal, listenerBus)->SparkEnv.set(_env)
    5. _statusTracker = new SparkStatusTracker(this)
    6. _progressBar/_ui/_hadoopConfiguration/_executorMemory/executorEnvs
    7. _heartbeatReceiver = env.rpcEnv.setupEndpoint(HeartbeatReceiver.ENDPOINT_NAME, new HeartbeatReceiver(this))
    8. val (sched, ts) = SparkContext.createTaskScheduler(this, master, deployMode)
    9. _schedulerBackend /_taskScheduler /_dagScheduler
    10.  _heartbeatReceiver.ask[Boolean](TaskSchedulerIsSet)
    11. _taskScheduler.start()
    12.  _env.blockManager.initialize(_applicationId)
    13. _env.metricsSystem.start()
    14. _executorAllocationManager.foreach(_.start())
    15. setupAndStartListenerBus()
    16. postEnvironmentUpdate()
    17. postApplicationStart()
    18. _taskScheduler.postStartHook()
    19. _env.metricsSystem.registerSource
    20. _shutdownHookRef = ShutdownHookManager.addShutdownHook()

 

    }catch{

       ……

    }

 

 

  • RDDOperationScope解读

0. withScope 简述:https://www.jianshu.com/p/8a3958337aea

1. 源码解读:https://blog.csdn.net/qq_21383435/article/details/79666170

2. 其他说明:http://www.mamicode.com/info-detail-1066067.html

 

  • coalesce()方法和repartition()方法

https://blog.csdn.net/lzq20115395/article/details/80602071

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值