spark on yarn 环境配置

没￥开会员

已于 2023-11-03 11:52:32 修改

阅读量312

点赞数

分类专栏： spark 文章标签： spark 大数据分布式

于 2023-10-20 18:30:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44779906/article/details/133933839

版权

一、前提准备

1、dfs，yarn 可用

2、我使用的是anaconda 加载了pyspark

安装pyspark 是需要使用pycharm; spark本身有pyspark库

3、每节点都是python3的环境

二、实现

1、spark配置路径：/export/server/spark

2、配置依赖spark jar包

当Spark Application应用提交运行在YARN上时，默认情况下，每次提交应用都需要将依赖Spark相关jar包上传到YARN 集群中，为了节省提交时间和存储空间，将Spark相关jar包上传到HDFS目录中，设置属性告知Spark Application应用。

1、修改spark-env.sh（只针对安装了pyspark库的节点）

vim conf/spark-env.sh

HADOOP_CONF_DIR=/export/server/hadoop/etc/hadoop
YARN_CONF_DIR=/export/server/hadoop/etc/hadoop
SPARK_HISTORY_OPTS="-Dspark.history.fs.logDirectory=hdfs://node1:8020/sparklog/ -Dspark.history.fs.cleaner.enabled=true"

2 、修改hadoop的yarn-site.

最低0.47元/天解锁文章

没￥开会员

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
spark on yarn 环境配置

当Spark Application应用提交运行在YARN上时，默认情况下，每次提交应用都需要将依赖Spark相关jar包上传到YARN 集群中，为了节省提交时间和存储空间，将Spark相关jar包上传到HDFS目录中，设置属性告知Spark Application应用。-- 设置聚合日志在hdfs上的保存时间 -->-- 设置yarn集群的内存分配方案 -->-- 设置yarn历史服务器地址 -->-- 配置yarn主节点的位置 -->-- 关闭yarn内存检查 -->-- 开启日志聚合功能 -->
复制链接

扫一扫

专栏目录

没￥开会员 CSDN认证博客专家 CSDN认证企业博客

码龄5年

30: 原创

135万+: 周排名

9万+: 总排名

7619: 访问

: 等级

324: 积分

17: 粉丝

20: 获赞

13: 评论

32: 收藏

私信

关注

热门文章

分类专栏

hive 2篇
hadoop 1篇
iceberg 1篇
VM 5篇
sqoop 2篇
spark 8篇
zk 1篇
presto 3篇
python 4篇
mysql 2篇
其他 1篇

最新评论

presto配置
CSDN-Ada助手: 恭喜您写下了第8篇博客，标题为“presto配置”！看到您持续创作的努力，我感到非常高兴。从您的博客标题来看，我可以想象到您对Presto配置的深入研究。希望您可以进一步扩展这个主题，例如分享一些常见的配置问题及其解决方案，或者提供一些优化配置的实用技巧。期待您在未来的创作中继续努力，并分享更多有价值的知识！
hadoop 最精简配置
CSDN-Ada助手: 非常欣赏您对hadoop最精简配置的探索和分享！恭喜您写下了第10篇博客！您的持续创作无疑为我们提供了宝贵的经验和见解。在下一步的创作中，或许您可以考虑分享一些关于hadoop配置细节的技巧，或者探索不同场景下的最佳实践。期待继续阅读您的博客，谢谢您的付出！
rdd算子
CSDN-Ada助手: 恭喜您写了第18篇博客，题为“rdd算子”。您的持续创作真令人钦佩！通过您的博客，我对rdd算子有了更深入的了解。您的解释简洁明了，让我能够轻松理解这个概念。我非常期待您下一篇博客的发布，希望您能继续分享关于rdd算子的更多实际应用案例或者深入研究。谦虚地说，我相信您的下一篇博客将会给读者带来更多的启发和帮助。再次感谢您的分享，期待您的下一步创作！
spark on yarn 环境配置
CSDN-Ada助手: 恭喜您写了第19篇博客！标题为“spark on yarn 环境配置”，看起来是一个非常实用的主题。您的博客内容一定对那些对于spark on yarn环境配置有兴趣的读者们非常有帮助。希望您能继续保持创作的热情和努力，不断分享您的经验和知识。在下一步的创作中，我建议您可以进一步深入探讨spark on yarn环境配置的具体步骤和技巧，或者分享一些实际应用案例。此外，您可以考虑与读者们互动，了解他们在环境配置中遇到的问题，并提供解决方案。这样能够更好地满足读者们的需求，并丰富您的博客内容。再次恭喜您，并期待您未来更多精彩的博客！
python jieba分词
CSDN-Ada助手: 恭喜您写了第20篇博客！标题中提到的“python jieba分词”确实是一个非常有趣和实用的主题。通过您的文章，我对jieba分词有了更深入的了解。在下一步的创作中，我建议您可以尝试探索更多关于jieba分词的应用场景，例如如何在自然语言处理中使用jieba分词，或者如何结合其他Python库来优化分词结果。这样的话，读者可以更全面地了解jieba分词的潜力和局限性。再次恭喜您的创作成果，期待您在未来的博客中分享更多有趣的主题！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。