Spark存储体系

Spark的存储体系从Spark集群的横向角度看,贯穿了集群中的每个实例;从单个节点看,Spark的存储体系隶属于SparkEnv。

在之前的分析中,BroadcastManager对广播对象进行广播时离不开存储体系的支持;除此之外,无论是SparkContext的初始化,还是任务的提交与执行,始终都离不开存储体系。Spark为了避免Hadoop频繁读写磁盘造成磁盘I/O成为性能瓶颈,优先会将配置信息、计算结果等数据存入内存,这极大地提升了系统的执行效率。

下面将从以下几方面讲解Spark存储体系的构造:

  1. 存储体系概述
  2. BlockInfoManger
  3. 磁盘Block管理器
  4. 磁盘存储DiskStore
  5. 内存管理器
  6. 内存存储MemoryStore
  7. 块管理器BlockManager
  8. BlockManagerMaster对BlockManager的管理
  9. Block传输服务
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值