自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (2)
  • 收藏
  • 关注

原创 Spark-2.4.0 源码学习系列《Worker的启动过程》

目录一、Worker的main方法二、Worker初始化过程2.1 参数初始化2.2 onStart2.2.1 tryRegisterAllMasters()2.2.2 Option(self).foreach(_.send(ReregisterWithMaster))三、 总结    Worker和Master一样,在Spark通信架构中都是一个EndPoint,...

2019-01-30 19:19:59 345

原创 Spark-2.4.0 源码学习系列《Master的启动过程》

目录一、Master启动主流程1.1 Master main方法    1.2 startRpcEnvAndEndpoint(...)1.3 rpcEnv.setupEndpoint(...)二、Master启动需要注意的地方2.1 Dispatcher的线程池2.2 Inbox.process(...)三、Master的初始化过程3.1 参数初始化3.2 ...

2019-01-28 17:53:15 353

原创 Spark-2.4.0 源码学习系列《通信框架》之RpcEnv(NettyRpcEnv)

    RpcEnv是一个RPC环境, RpcEndPoint需要将自身注册到RpcEnv才能接收信息。RpcEnv将会处理RpcEndPointRef或远程节点发来的消息,并将消息传送给相应的RpcEndPoint.对于业务代码未捕获的的异常,RpcEnv会使用RpcCallContext.sendFailure方法将他们的发送回给发送方,或者打出日志(如果没有调用方),亦或者是NotSeria...

2019-01-28 11:02:28 521

原创 Spark-2.4.0 源码学习系列《通信框架》之Dispatcher

    Dispatcher是Spark通信框架中的消息分发器,会在NettyRpcEnv初始化的时候创建,NettyRpcEnv的初始化过程我们以后再谈,现在我们先看一下Dispatcher初始化时都干了哪些事。 private val endpoints: ConcurrentMap[String, EndpointData] = new ConcurrentHashMap[S...

2019-01-26 21:32:53 604

转载 Spark通信架构(转载)

声明:该博客整理自尚硅谷2018出的一套教学视频,Spark章节由武玉飞老师主讲,非本人原创。目录一、概述二、通信组件概览三、 EndPoint启动流程四、EndPoint Send&Ask流程五、EndPoint receive 流程六、EndPoint Inbox处理流程七、EndPoint画像一、概述Spark作为分布式计算框架,多个节点的设计...

2019-01-26 20:08:59 1140

原创 Spark-2.4.0 源码学习系列《二》 - SparkContext

SparkContext 是Spark功能的主入口。一个SparkContext 代表一个spark集群的链接,可以用来在集群上创建RDD,累加器和广播变量。每个JVM中只能有一个活动的SparkContext。必须在创建新的SparkContext之前调用 stop()方法来停止当前处于active状态的SparkContext。这个限制最终可能会被移除。下面我们来看看我们使用 val sc...

2019-01-26 16:40:35 455

原创 Spark-2.4.0 源码学习系列《一 》 - SparkConf

SparkConf是Spark程序的配置类,以键值对的方式存储各种各样的Spark参数。通常情况下,可以通过 new SparkConf()来创建一个Sparkconf对象,这种方式会加载Java系统属性中任何以“spark.”开头的参数,并设置到应用程序中。SparkConf中设置的参数相较于系统属性具有优先级(会覆盖系统参数)。SparkConf中最重要的一个参数是settings,是一个Co...

2019-01-26 16:31:08 408 1

2021 Building the Unified Data Warehouse and Data Lake.pdf

2021 Building the Unified Data Warehouse and Data Lake.pdf

2021-08-26

Pro Apache Hadoop 2nd Edition 2014

Pro Apache Hadoop 2nd Edition 2014

2017-08-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除