Spark程序的入口之SparkContext

本文介绍了Spark程序的入口SparkContext,它负责通过资源管理器访问集群。主要流程包括加载SparkConf创建SparkEnv,创建TaskScheduler,建立DAGScheduler以及启动SparkUI。SparkUI的默认端口为4040,方便开发者监控应用状态。后续篇章将深入讲解DAGScheduler和TaskScheduler。
摘要由CSDN通过智能技术生成

       今天讲的是sparkContext,这是spark程序的入口,每次写spark程序,首先你得: new sparkContext(conf),参数里是sparkConf,也就是一些相关配置参数。SparkContext 允许driver 应用程序通过资源管理器访问集群,这个资源管理器可以是yarn,mesos,或者是spark集群管理器。sparkContext具体干哪些活呢?细节可以说比较复杂的,我们这里只抽取最重要的几点进行讲解。

       主体流程图如下:



   下面我们一一来讲解:

  1. 加载配置文件SparkConf,创建SparkEnv

  2. 创建TaskScheduler

  3. 创建DAGScheduler

  4. 创建SparkUI

   


 1.加载配置文件SparkConf,创建SparkEnv

     这个很好理解,我们需要在程序指定像master地址,appName,,,,,,,这是初始化sparkContext的时候要加载配置文件或者相关配置参数,准备好spark环境,我们可以看下sparkContext的源码:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值