梳理对Spark Standalone的理解

最新推荐文章于 2024-08-26 15:45:04 发布

张包峰

最新推荐文章于 2024-08-26 15:45:04 发布

阅读量8k

点赞数 2

分类专栏： Spark 资源管理文章标签：任务调度 Spark 资源管理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pelick/article/details/43762375

版权

本文详细解析Spark Standalone模式的执行流程，包括Master、Worker和App的角色，资源分配逻辑，以及Task的启动与管理。阐述了Spark在资源层面和任务调度层面的分层设计，展示了其在集群中的高效运作机制。

摘要由CSDN通过智能技术生成

背景

本文不打算从源码分析的角度看standalone如何实现，甚至有的模块和类在分析中都是忽略掉的。

本文目的是透过spark的standalone模式，看类似spark这种执行模式的系统，在设计和考虑与下次资源管理系统对接的时候，有什么值得参考和同通用的地方，比如说接口和类体系，比如说各个执行层次的划分：面向资源的部分 vs 面向摆放的部分；面向资源里面进程的部分 vs 线程的部分等。对这些部分谈谈体会。

执行流程

解释standalone执行原理可以抛开Driver和Client。

首先，简单说明下Master、Worker、App三种角色。

Application：带有自己需要的mem和cpu资源量，会在master里排队，最后被分发到worker上执行。app的启动是去各个worker遍历，获取可用的cpu，然后去各个worker launch executor。

Worker：每台slave起一个(也可以起多个)，默认或被设置cpu和mem数，并在内存里做加减维护资源剩余量。Worker同时负责拉起本地的executor backend，即执行进程。

Master：接受Worker、app的注册࿰

最低0.47元/天解锁文章

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

张包峰 CSDN认证博客专家 CSDN认证企业博客

码龄14年

158: 原创

6万+: 周排名

209万+: 总排名

110万+: 访问

: 等级

1万+: 积分

874: 粉丝

353: 获赞

234: 评论

143: 收藏

私信

关注

热门文章

分类专栏

最新评论

GraphX 实现K-Core
满眼醉意: 你好请问你那些参数是什么意思 val kNum = 200 var lastVerticeNum: Long = degreeGraph.numVertices var thisVerticeNum: Long = -1 var isConverged = false val maxIter = 10 var i = 1
DRF算法
雪落潇寒: 哥打错字了，用户B的每个任务都请求（3CPU，1GB）。
DRF算法
baimeicomehere: Consider a system with of 9 CPUs, 18 GB RAM, and two users, where user A runs tasks with demand vector h1 CPU, 4 GBi, and user B runs tasks with demand vector h3 CPUs, 1 GBi each. 考虑一个有9个cpu和18GB的系统，有两个用户：用户A的每个任务都请求（1CPU，4GB）资源；用户B的每个任务都请求（3CPU，4GB）资源翻译对别－－”“
GraphX 图数据建模和存储
野老杂谈: 说的啥
pyspark原理简介
beijishiqidu: 兄弟，这篇文章我转走了哈，我会注明出处的，如果不行的话，可以告诉我，我立马删除，多谢。我的网站http://www.beijishiqidu.com/

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。