大数据处理3

m0_70195310

于 2023-06-16 14:51:12 发布

阅读量51

点赞数

文章标签：大数据 hadoop spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_70195310/article/details/131246889

版权

Spark开发环境准备工作
由于Spark仅仅是一种计算框架，不负责数据的存储和管理，因此，通常都会将Spark和Hadoop进行统一部署，由Hadoop中的HDFS、HBase等组件负责数据的存储管理，Spark负责数据计算。

安装Spark集群前，需要安装Hadoop环境
一）Standalone模式
Standalone模式被称为集群单机模式。该模式下，Spark集群架构为主从模式，即一台Master节点与多台Slave节点，Slave节点启动的进程名称为Worker，存在单点故障的问题。
（二）Mesos模式
Mesos模式被称为Spark on Mesos模式。Mesos是一款资源调度管理系统，为Spark提供服务，由于Spark与Mesos存在密切的关系，因此在设计Spark框架时充分考虑到对Mesos的集成。
（三）Yarn模式
Yarn模式被称为Spark on Yarn模式，即把Spark作为一个客户端，将作业提交给Yarn服务。由于在生产环境中，很多时候都要与Hadoop使用同一个集群，因此采用Yarn来管理资源调度，可以提高资源利用率。

下载、安装与配置Spark

官网下载页面：https://spark.apache.org/downloads.html

将Spark安装包上传到虚拟机

将Spark安装包解压到指定目录

配置Spark环境变量

Spark Standalone架构
Spark Standalone模式为经典的Master/Slave（主/从）架构，资源调度是Spark自己实现的。在Standalone模式中，根据应用程序提交的方式不同，Driver（主控进程）在集群中的位置也有所不同。应用程序的提交方式主要有两种：client和cluster，默认是client。可以在向Spark集群提交应用程序时使用--deploy-mode参数指定提交方式。

停止Spark集群服务

在master节点执行命令：stop-all.sh

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

m0_70195310 CSDN认证博客专家 CSDN认证企业博客

码龄3年

16: 原创

150万+: 周排名

36万+: 总排名

3292: 访问

: 等级

160: 积分

0: 粉丝

0: 获赞

4: 评论

1: 收藏

私信

关注

热门文章

分类专栏

数据库 4篇

最新评论

大数据实时处理1
CSDN-Ada助手: 非常感谢用户的辛勤创作，看到您的第七篇博客，我感到非常欣慰。您对大数据实时处理的探讨非常有深度，让我们受益匪浅。接下来，我希望您可以更多地分享您对大数据的见解和实践经验，让我们一起学习，共同成长。再次祝贺您，期待您的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。
大数据处理2
CSDN-Ada助手: 恭喜作者写出了《大数据处理2》这篇新博客！不断探究大数据处理的领域，难能可贵。希望下一步能够深入挖掘大数据处理的一些具体技术细节，给读者带来更多有价值的知识。期待您的下一篇作品！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。
大数据处理3
CSDN-Ada助手: 恭喜作者发布了第9篇博客《大数据处理3》，非常高兴看到您一直在不断创作。同时，我认为您可以尝试在下一篇博客中分享一些具体的应用案例，这将有助于读者更好地理解和应用大数据处理技术。感谢您的分享，期待更多精彩的文章。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。
大数据处理4
CSDN-Ada助手: 恭喜您写下了第10篇博客，真是一份坚持和努力的成果。从标题中可以看出，您对大数据处理的知识已经有了一定的积累和应用。希望您能够在今后的创作中更深入地探究这个领域，或者尝试一些与之相关的主题，让读者看到更多不同的角度和思考方式。期待您的继续创作，谢谢您的分享。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。