2023_Spark_实验三十三：配置Standalone模式Spark3.4.2集群

最新推荐文章于 2024-08-12 23:51:20 发布

pblh123

最新推荐文章于 2024-08-12 23:51:20 发布

阅读量1.3k

点赞数 9

分类专栏： Spark实验 Linux Spark 文章标签： spark 大数据分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pblh123/article/details/135196923

版权

Spark实验同时被 3 个专栏收录

31 篇文章 4 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

实验目的：掌握Spark Standalone部署模式

实验方法：基于centos7部署Spark standalone模式集群

实验步骤：

一、下载spark软件

下载的时候下载与自己idea里对应版本的spark

News | Apache Spark

选择任意一个下载即可
- spark 3.4.1
- spark 3.4.2

二、安装Standalone模式部署spark

将下载好的spark软件上传到指定的linux集群中

# 解压到指定目录
tar -zxvf spark-3.4.2-bin-hadoop3-scala2.13.tgz -C /opt/module/spark/

# 更改所有权
chown -R hadoop:hadoop spark-3.4.2-bin-hadoop3-scala2.13/

配置环境变量

配置Spark配置文件

- spark-defaults.conf

- spark-env.sh

- workers

spark-defaults.conf配置如下

spark-env.sh配置如下

workers配置如下

配置spark一键启动脚本

启动spark standalone模式集群

三、验证Spark Standalone模式集群

登录hd1节点查看spark webUI 【记得改成自己对应的集群ip】

# 测试代码
spark-submit --class org.apache.spark.examples.SparkPi \
--driver-memory 512m \
--executor-memory 512m \
$SPARK_HOME/examples/jars/spark-examples_2.13-3.4.2.jar 10

spark-submit --class org.apache.spark.examples.SparkPi \
$SPARK_HOME/examples/jars/spark-examples_2.13-3.4.2.jar 10

实验结果：基于centos7完成Spark standalone模式集群部署

分析一个小工具，文件同步工具xsync，该工具可以将hd1节点上文件，文件夹分发到hd1,hd2,hd3节点

关注

9
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

pblh123 CSDN认证博客专家 CSDN认证企业博客

码龄13年

安艾艾迪信息技术（上海）有限公司

118: 原创

1万+: 周排名

1万+: 总排名

17万+: 访问

: 等级

2053: 积分

4937: 粉丝

841: 获赞

20: 评论

1026: 收藏

私信

关注

热门文章

分类专栏

Spark实验 31篇
Spark 10篇
Scala 16篇
MindSpore实践 21篇
MindSpore 25篇
可视化大屏 18篇
容器 1篇
工具使用 1篇
IDEA 6篇
Linux 10篇
flume 2篇
Java 4篇
windows 1篇
WMware 1篇
Centos7 3篇
RedHat 1篇
Hadoop 15篇
MySQL 2篇
数仓 1篇
SQL 3篇

最新评论

基于Scala开发Spark ML的ALS推荐模型实战
pblh123: 在 Spark 的机器学习中，如果某个用户的评分数据全部被划分到了测试集，在对这个用户进行推荐（transform）时，确实有可能出现 NaN 的情况。原因是当进行推荐计算时，如果没有该用户在训练集中的数据，模型可能无法准确预测该用户的偏好，从而导致结果出现缺失值（NaN）。为了避免这种情况，可以考虑以下方法： 1. 调整数据集划分策略，确保每个用户的部分数据在训练集中，以便模型能够学习到该用户的一些特征。 2. 使用更合适的推荐算法，一些算法可能对数据缺失有更好的处理方式。
基于Scala开发Spark ML的ALS推荐模型实战
Ocean_Hai22: 我有个问题想请教，如果划分数据集时，某个用户的评分数据全部都被划分到了测试集，当对这个用户进行推荐时(即transform那里)，你这里不会得到NaN吗？
昇思25天学习打卡营第9天|MindSpore-Vision Transformer图像分类
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619124193。
【可视化大屏开发】15.可视化大屏项目-网络访问静态数据无法更新问题修复
pblh123: 拼写检查错误有没有
【可视化大屏开发】15.可视化大屏项目-网络访问静态数据无法更新问题修复
过堂风QAQ: applicant.property也配置了，显示的No usages found in Project Files。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。