1,客户端向resource manager申请资源,返回一个application id
2,客户端上传spark jars下的jar包,自己写的jar包和配置
3,resource manager随机找一个资源充足的node manager
4,然后通过rpc让noda manager从hdfs上下载 jar包和配置,启动application master
5,application master想resource manager申请资源
6,resource manager中的resource scheduler找到符合条件的node manager,将node manager的信息返回给application master
7,application master跟返回的node manager进行通信
8,node manager从hdfs下载依赖
9,node manager启动excutor
10,excutor启动后向application master进行注册
Spark On Yarn Cluster模式执行流程
最新推荐文章于 2022-01-13 10:30:11 发布