【spark笔记】RDD解释和Spark架构

最新推荐文章于 2022-06-27 14:25:55 发布

掌心里的海-Canace

最新推荐文章于 2022-06-27 14:25:55 发布

阅读量293

点赞数

分类专栏： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37911384/article/details/80489789

版权

spark 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

1、什么是RDD？

1、 RDD是Spark提供的核心抽象，弹性分布式数据集。

2、 RDD在抽象上来说是一种元素集合，包含了数据，它是被分区的，分为多个分区，每个分区分布在集群的不同节点上，从而让RDD的数据可以并行操作。

3、 RDD通常通过hadoop上的文件，即HDFS文件或者hive表，来进行创建，有时也可以通过应用程序中的集合来创建。

4、 RDD最重要的特性就是：提供了容错性，可以自动从节点失败中恢复过来，即如果某个节点上的RDDpartition，因为节点故障，导致数据丢失，那么RDD会自动通过自己的数据源重新计算该partition、这一切对使用者都是透明的

5、 RDD的数据默认情况下放在内存中，但是内存资源不足，spark会自动将RDD的数据写入磁盘。

2、Spark的架构：

spark采用的主从式的架构，主节点叫master，从节点叫worker

driver：在client模式下，哪一台服务器提交spark代码，那么哪一台机器就是driver服务器。（如果提交10个程序，10个driver服务器在同一台，压力大）在集群模式下，driver服务器并不是提交代码的那一台服务器，而是在提交代码的时候，在worker主机上随机挑一台作为driver服务器，如果提交10个应用，name就有可能10台driver服务器。

master：master是集群的资源管理者和调度者，类似于YARN里面的ResourceManager，还负责监控整个集群的监控状况。

spark执行流程：

1、启动driver，会做一些初始化工作，在初始化这个过程当中，会发送请求到master，请求注册。这样以后我们的master就知道有活要干了。

2、master接受到请求之后，master发送请求到worker，请求资源调度，说白了请求资源调度就是需要在worker节点上启动executor（具体应该启动几个executor，是在提交代码的时候指定好了的）。

3、executor启动好了以后会向driver进行反向注册，这样driver就知道哪些executor为它的任务进行服务了。

4、driver注册了executor后，这才开始执行spark程序，首先创建RDD，后面就是对RDD进行算子操作，我们会根据对这些 RDD的定义，会形成一堆Task任务，比如进行flatMap，map，reduceByKey等等操作

5、task任务会对RDD里面的partition进行算子操作

掌心里的海-Canace

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

掌心里的海-Canace CSDN认证博客专家 CSDN认证企业博客

码龄8年

51: 原创

29万+: 周排名

77万+: 总排名

10万+: 访问

: 等级

1332: 积分

505: 粉丝

39: 获赞

29: 评论

148: 收藏

私信

关注

热门文章

分类专栏

ELK 5篇
JAVA 7篇
spark 8篇
转载
代码
问题记录 1篇
linux 9篇
安全
随笔 7篇
大数据 6篇
源码 1篇
运维 1篇

最新评论

Logstash系列之--JAVA自定义插件
3×7: versions.yml里面是啥内容
spark-webUI添加权限认证
掌心里的海-Canace: spark.acls.enable=true这个有设置吗？
spark-webUI添加权限认证
weixin_41735413: 按这个去处理了，但是没生效，这是什么原因了,spark2.4.8 访问后也没出现需要登录的页面，还是不需要用户名密码
Logstash系列之--JAVA自定义插件
qq_50699358: 为什么我生成jar包的时候说找不到安全认证的证书。 Build file 'D:\Git\logstash\build.gradle' line: 342 sun.security.validator.ValidatorException: PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException: unable to find valid certification path to requested target
spark-webUI添加权限认证
I-NullMoneyException: 请问下我想在您的基础上加上部分IP过滤，在init里面ips = filterConfig.getInitParameter("ips"); LOG.error("ips-1:",ips);打印不出来，然后在else中直接 //固定IP过滤 if(ips.contains(ip)){ filterChain.doFilter(servletRequest, servletResponse); } unauthorized(response); 这样也过滤不了，这是什么原因啊

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。