20、Spark核心编程之Spark架构原理

  1. Driver
    Driver(进程),我们编写的Spark程序就在Driver上,由Driver进程执行
  2. Master
    Master是个进程,主要是负责资源的调度和分配,还有集群的监控等等职责
  3. Worker
    Worker是个进程,主要负责有两个,一个是用自己的内存,存储RDD的某个或某些partition,另一个是启动其他进程和线程,对RDD上的partition进行并行的处理和计算
  4. Executor
  5. Task
    Executor和Task,其实就是负责执行,对RDD的partition进行并行计算,也就是执行我们对RDD定义的,比如map、flatMap、reduce等算子操作

     

    13274599-cd4aaae3b5f02fdb.png

    Spark架构原理.png

  1. Driver进程启动后,会做一些初始化操作,在这个过程中,就会发送请求到Master上,进行Spark应用程序的注册,说白了,就是让master知道,有一个新的Spark应用程序要运行
  2. Master,在收到了Spark应用程序的注册申请之后,会发送请求给Wroker,进行资源的调度和分配,资源分配,就是executer的分配
  3. Wroker收到Master的请求之后,会为Spark应用启动Executor
  4. Executor启动之后,会向Driver进行反注册,这样,Driver就知道,哪些Executor是为它进行服务的了
  5. Driver注册了一些Executor之后,就可以开始正式执行我们的spark应用程序了,首先第一步,就是创建初始RDD读取数据源
  6. HDFS文件内容被读取到多个Worker节点上,形成内存中的分布式数据集,也就是初始RDD
  7. Driver会根据我们对RDD定义的操作,提交一大堆task去Executor上
  8. Executor收到task之后,会启动多个线程来执行task
  9. task就会对RDD的partition数据执行指定的算子操作,形成新的RDD的partition,然后Driver就会向Executor提交新的task
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 内容概要 《计算机试卷1》是一份综合性的计算机基础和应用测试卷,涵盖了计算机硬件、软件、操作系统、网络、多媒体技术等多个领域的知识点。试卷包括单选题和操作应用两大类,单选题部分测试学生对计算机基础知识的掌握,操作应用部分则评估学生对计算机应用软件的实际操作能力。 ### 适用人群 本试卷适用于: - 计算机专业或信息技术相关专业的学生,用于课程学习或考试复习。 - 准备计算机等级考试或职业资格认证的人士,作为实战演练材料。 - 对计算机操作有兴趣的自学者,用于提升个人计算机应用技能。 - 计算机基础教育工作者,作为教学资源或出题参考。 ### 使用场景及目标 1. **学习评估**:作为学校或教育机构对学生计算机基础知识和应用技能的评估工具。 2. **自学测试**:供个人自学者检验自己对计算机知识的掌握程度和操作熟练度。 3. **职业发展**:帮助职场人士通过实际操作练习,提升计算机应用能力,增强工作竞争力。 4. **教学资源**:教师可以用于课堂教学,作为教学内容的补充或学生的课后练习。 5. **竞赛准备**:适合准备计算机相关竞赛的学生,作为强化训练和技能检测的材料。 试卷的目标是通过系统性的题目设计,帮助学生全面复习和巩固计算机基础知识,同时通过实际操作题目,提高学生解决实际问题的能力。通过本试卷的学习与练习,学生将能够更加深入地理解计算机的工作原理,掌握常用软件的使用方法,为未来的学术或职业生涯打下坚实的基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值