大数据处理 | Spark集群搭建及基本使用

最新推荐文章于 2023-04-11 16:00:44 发布

yiyidsj

最新推荐文章于 2023-04-11 16:00:44 发布

阅读量444

点赞数 1

分类专栏：大数据人工智能互联网文章标签： Spark 大数据大数据学习大数据开发大数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yiyidsj/article/details/104183480

版权

启动Spark集群

如果要使用HDFS的话，在启动Spark集群前需要先启动Hadoop集群，

$cd/usr/local/hadoop/$./sbin/start-all.sh

然后进入Spark目录，启动Spark集群，

$cd/usr/local/spark$./sbin/start-all.sh

需要说明一下，前面配置Hadoop集群是提到，需要配置ssh免密登陆，对于Spark也是同样的道理，如果不配置ssh免密登陆的话，执行./sbin/start-all.sh会提示输入密码。

除了使用./sbin/start-all.sh启动Spark集群外，还可以分开启动，先启动master节点，然后启动slave节点，

$./sbin/start-master.sh$./sbin/start-slaves.sh

如果前面没有完成Master节点配置指定master节点IP，那么执行./sbin/start-slaves.sh时则无法注册master节点的IP，这样集群计算资源则无法使用。除了配置spark-env.sh指定master节点IP外，还可以通过下面方式指定注册的master节点IP，

$./sbin/start-slave.sh10.110.113.132

然后分别在master节点和slave节点执行下面命令会看到分别多出一个Master进程和Worker进程。

Spark基本使用

运行原理

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据处理 | Spark集群搭建及基本使用

启动Spark集群如果要使用HDFS的话，在启动Spark集群前需要先启动Hadoop集群，$cd/usr/local/hadoop/$./sbin/start-all.sh然后进入Spark目录，启动Spark集群，$cd/usr/local/spark$./sbin/start-all.sh需要说明一下，前面配置Hadoop集群是提到，需要配置ssh免密登陆，对于Spa...
复制链接

扫一扫

专栏目录

yiyidsj CSDN认证博客专家 CSDN认证企业博客

码龄4年

48: 原创

55万+: 周排名

213万+: 总排名

3万+: 访问

: 等级

852: 积分

10: 粉丝

23: 获赞

8: 评论

89: 收藏

私信

关注

热门文章

分类专栏

大数据 47篇
互联网 48篇
人工智能 48篇

最新评论

手把手带你入门PySpark！
aidedmniy: PySpark大数据处理及机器学习Spark2.3视频教程 https://download.csdn.net/download/cxlmsywpq/39431607
PySpark初级教程——大数据分析(附代码实现 )
hnmwykka: PySpark大数据处理及机器学习Spark2.3视频教程 https://download.csdn.net/download/haoyunqilai/39098116
PySpark和大数据处理初探
qwmwysr: PySpark大数据处理及机器学习Spark2.3视频教程 https://download.csdn.net/download/haoyunqilai/39098116
Spark RDD是什么？
不是论大大: 顶
大数据开发零基础需要学习什么内容？（3）Spark生态体系
ctotalk: 感谢分享，学以致用。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。