Spark设计理念和基本架构

zhixingheyi_tian

已于 2024-02-22 21:45:18 修改

阅读量316

点赞数

分类专栏： spark 文章标签： spark 架构大数据

于 2020-01-19 16:49:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhixingheyi_tian/article/details/104040552

版权

spark 专栏收录该内容

106 篇文章 4 订阅

订阅专栏

Spark 特点

减少Disk IO

Spark 将资源文件（jar 等），缓存在driver 本地文件服务的内存里，当Executor执行任务时直接从 Driver 的内存中读取

增加并行度

多个stage 之间允许串行也可以并行

避免重新计算

当stage 中某个分区的task 失败，会重新对此stage 调度，但重新调度时会过滤掉已经成功执行的分区task

较为灵活的内存管理策略

四个部分

onheap 存储内存
onheap 执行内存
offheap 存储内存
offheap 执行内存

执行内存和存储内存之间可以互相借用

Spark 模块设计

SparkContext

Spark 应用程序的提交和执行都离不开 SparkContext，
SparkSession的底层实现依赖于 SparkContext

SparkSession、SQLContext、 HiveContext等都对SparkContext
进行了封装，并提供了DataFrame、 SQL、Hive 接口
用户可以SparkContext 提供的接口编写 Driver 应用程序

SparkEnv

SparkEnv 是 Spark 中 task 允许时所必须的组件

Spark 基本架构

Cluster Manager

Yarn 模式下，为 ResourceManager
StandAlone 模式下，为master

worker

Yarn 模式下，为 NodeManager

spark的数据本地性（data locality）

参考链接： https://www.cnblogs.com/lillcol/p/14838348.html

zhixingheyi_tian

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark设计理念和基本架构

Spark 特点减少Disk IOSpark 将资源文件（jar 等），缓存在driver 本地文件服务的内存里，当Executor执行任务时直接从 Driver 的内存中读取增加并行度多个stage 之间允许串行也可以并行避免重新计算当stage 中某个分区的task 失败，会重新对此stage 调度，但重新调度时会过滤掉已经成功执行的分区task较为灵活的内存管理策略四个部分...
复制链接

扫一扫

专栏目录

zhixingheyi_tian CSDN认证博客专家 CSDN认证企业博客

码龄7年

440: 原创

3万+: 周排名

6900: 总排名

28万+: 访问

: 等级

6002: 积分

189: 粉丝

86: 获赞

89: 评论

201: 收藏

私信

关注

热门文章

分类专栏

最新评论

C语言那些事之动态库
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性；(3)增加条理清晰的目录。
C语言那些事之动态库
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)使用更多的站内链接；(3)增加条理清晰的目录。
JNI 相关
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
Spark 之 HiveStrategies
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
性能优化工具
Byyyi耀: 大佬互关吗？非常不错的文章，解决了我大问题！赞一个！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。