spark2.2.0源码阅读---spark core包 --- security/serializer/status/io/input/metrics/mapred/internal

最新推荐文章于 2024-10-11 14:41:19 发布

danlial

最新推荐文章于 2024-10-11 14:41:19 发布

阅读量204

点赞数

分类专栏： spark源码文章标签： spark spark源码

本文链接：https://blog.csdn.net/dianlial/article/details/80365352

版权

9 篇文章 0 订阅

订阅专栏

1、本文目标以及其它说明：

因为这几个包目标明确，类也不多，所以全部弄在一起研究。这里不会所有的数据结构都会讲到，主要是掌握

重点。

security包：

private[spark] object CryptoStreamUtils extends Logging  对IO流进行加密、解密

trait GroupMappingServiceProvider 给到用户，返回用户组，概念和linux权限组类似

private[spark] class ShellBasedGroupsMappingProvider extends GroupMappingServiceProvider

其实就是读取的liux操作系统的权限组

private[spark] class SocketAuthHelper(conf: SparkConf) 对连接客户端和服务器端的套接字socket进行

secret认证

private[spark] class SerializerManager( 对spark组件配置序列化器、压缩、加密器等

GenericAvroSerializer 、JavaSerializer、KryoSerializer 具体的序列化器

private[spark] trait SparkListenerInterface { 为spark 调度器的事件接口 应用、job、阶段、

任务、块管理器、执行器增删改。也就是说事件的回调方法

abstract class SparkListener extends SparkListenerInterface 并没有实现回调方法

trait SparkListenerEvent { 事件，在spark调度器调度的时候发生的事件。对应事件有对应的事件

的监听回调方法。

private[spark] class AppStatusListener( ）extends SparkListener with Logging

对监听方法进行了实现

public interface KVStore extends Closeable { 以key value的形式存储app的数据在本地机器上

private[spark] class ElementTrackingStore(store: KVStore, conf: SparkConf)

 extends KVStore {  KVStore实现类，增加了存储时候的触发器

trait CompressionCodec {

  def compressedOutputStream(s: OutputStream): OutputStream

  def compressedInputStream(s: InputStream): InputStream
}

本包下面就提供了用于数据压缩的类，具体包括：lz4/lzf/snappy/

这里面的主要是用来从hadoop文件系统读取数据的reader 和 inputformat

度量系统包，暂不研究

object SparkHadoopMapRedUtil extends Logging { 用来将分区输出到hadoop文件系统

和hadoop有关，不做深入研究

关注

专栏目录