Spark 定制版：013~Spark Streaming源码解读之Driver容错安全性

最新推荐文章于 2020-05-04 11:19:09 发布

zisheng_wang_DATA

最新推荐文章于 2020-05-04 11:19:09 发布

阅读量1.5k

点赞数 1

分类专栏： spark源码分析文章标签： spark 安全 Receiver DStream Generator

本文链接：https://blog.csdn.net/zisheng_wang_DATA/article/details/51685452

版权

spark源码分析专栏收录该内容

18 篇文章 1 订阅

订阅专栏

本讲内容：

a. ReceiverBlockTracker容错安全性
b. DStreamGraph和JobGenerator容错安全性

注：本讲内容基于Spark 1.6.1版本（在2016年5月来说是Spark最新版本）讲解。

上节回顾

上一讲中，我们从安全角度来讲解Spark Streaming，由于Spark Streaming会不断的接收数据、不断的产生job、不断的提交job。所以数据的安全性至关重要。

首先我们来谈谈，对于数据安全性的考虑：

a. Spark Streaming是基于Spark Core之上的，如果能够确保数据安全可好的话，在Spark Streaming生成Job的时候里面是基于RDD，即使运行的时候出现问题，那么Spark Streaming也可以借助Spark Core的容错机制自动容错

b. 对于executor的安全容错主要是数据的安全容错。Executor计算时候的安全容错是借助Spark core的RDD的，所以天然是安全的

那么Executor容错方式是什么呢？

a. 最简单的容错是副本方式，基于底层BlockManager副本容错，也是默认的容错方式

b. 接收到数据之后不做副本，支持数据重放，所谓重放就是支持反复读取数据

这里写图片描述

开讲

本讲我们从Spark Streaming源码解读Driver容错安全性：那么什么是Driver容错安全性呢？

a. 从数据层面：ReceivedBlockTracker为整个Spark Streaming应用程序记录元数据信息

b. 从调度层面：DStreamGraph和JobGenerator是Spark Streaming调度的核心，记录当前调度到哪一进度，和业务有关

c. 从运行角度: 作业生存层面，JobGenerator是Job调度层面

谈Driver容错性我们需要考虑Driver中有那些需要维持状态的运行

a. ReceivedBlockTracker跟踪了数据，因此需要容错。通过WAL方式容错

b. DStreamGraph表达了依赖关系，恢复状态的时候需要根据DStream恢复计算逻辑级别的依赖关系。通过checkpoint方式容错

c. JobGenerator表面是基于ReceiverBlockTracker中的数据，以及DStream构成的依赖关系不断的产生Job的过程。也可以这么理解这个过程中消费了那些数据，并且跟踪进行到了一个怎样的程度

具体分析如下图：

这里写图片描述

ReceivedBlockTracker

ReceivedBlockTracker会管理Spark Streaming运行过程中所有的数据。并且把数据分配给需要的batches，所有的动作都会被WAL写入到Log中，Driver失败的话，就可以根据历史恢复tracker状态，在ReceivedBlockTracker创建的时候，使用checkpoint保存历史目录

这里写图片描述

下面我们就走进Receiver，解密在收到数据之后，有事怎么处理的？

Receiver接收到数据，把元数据信息汇报上来，然后通过ReceiverSupervisorImpl就将数据汇报上来，就直接通过WAL进行容错

当Receiver的管理者，ReceiverSupervisorImpl把元数据信息汇报给Driver的时候，正在处理是交给ReceiverBlockTracker. ReceiverBlockTracker将数据写进WAL文件中，然后才会写进内存中，被当前的Spark Streaming程序的调度器使用的，也就是JobGenerator使用的。JobGenerator不可能直接使用WAL。WAL的数据在磁盘中，这里JobGenerator使用的内存中缓存的数据结构

ReceiverBlockTracker.addBlock源码

这里写图片描述