Spark on Yarn 搭建及填坑过程

最新推荐文章于 2023-10-03 14:31:24 发布

就想叫筷子

最新推荐文章于 2023-10-03 14:31:24 发布

阅读量207

点赞数

分类专栏： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44033089/article/details/87359422

版权

本文详细介绍了如何在个人电脑上搭建Spark on Yarn的环境，包括Hadoop和Spark的配置，如内存设置、YARN参数调整。同时，文章涵盖了Spark Shell验证、WordCount程序编写、提交运行以及遇到问题的解决方法，提供了完整的Maven工程配置示例。

摘要由CSDN通过智能技术生成

准备
1. hadoop-2.7.5
2. spark-2.0.0
3. scala-2.11.8.tar（Linux环境spark运行所需）及scala-2.11.8.msi（win开发环境所需）这两个要一致
搭建（由于是在个人电脑上作为练习，因此涉及内存大小的地方要根据电脑内存合理设置）
1. hadoop搭建（略）这块按照其他搭建过程能运行起来就行，下边几个参数需要添加到yarn-site.xml中
  <property>
     <name>yarn.nodemanager.resource.memory-mb</name>
     <value>2048</value>
  </property>
  
  <property>
     <name>yarn.scheduler.minimum-allocation-mb</name>
     <value>512</value>
  </property>
  
  <property>
     <name>yarn.scheduler.maximum-allocation-mb</name>
     <value>2048</value>
  </property>
  
  <property>
     <name>yarn.nodemanager.pmem-check-enabled</name>
     <value>false</value>
  </property>
  
  <property>
     <name>yarn.nodemanager.vmem-check-enabled</name>
     <value>false</value>
  </property>
2. spark搭建
  1. 解压spark的压缩包
  2. 将配置好的yarn-site.xml和core-site.xml从$HADOOP_HOME/etc/hadoop/拷贝一份到$SPARK_HOME/conf下
  3. 配置spark_env.sh，将如下配置添加到末尾
    1. export JAVA_HOME=/usr/local/jdk1.8
      export SCALA_HOME=/home/hadoop/scala-2.11.8
      export HADOOP_HOME=/home/hadoop/hadoop-2.7.5
      export HADOOP_CONF_DIR=/home/hadoop/hadoop-2.7.5/etc/hadoop
      export SPARK_WORKER_MEMORY=2048m
  4. 配置spark-defaults.conf，将如下配置添加到末尾
    1. spark.yarn.jars=hdfs://hadoop02:9000/sparkjars/* //这里的hadoop02:9000 代表集群的namenode所在节点，配置成

最低0.47元/天解锁文章

就想叫筷子

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

就想叫筷子 CSDN认证博客专家 CSDN认证企业博客

码龄6年

26: 原创

55万+: 周排名

81万+: 总排名

6万+: 访问

: 等级

901: 积分

10: 粉丝

15: 获赞

13: 评论

73: 收藏

私信

关注

热门文章

分类专栏

python 1篇
Oracle优化 9篇
JAVA基础
Hadoop 12篇
Oracle基础 11篇
Hive 7篇
spark 2篇
数据仓库 3篇

最新评论

oracle 管道表（pipelined table）函数与普通表函数简单对比
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加条理清晰的目录；(3)增加除了各种控件外，文章正文的字数。
python的yield、标准输入输出的使用练习
CSDN-Ada助手: Python是什么？为什么一定要学Python?
Oracle中关于8k表空间与16k表空间IO性能对比
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加条理清晰的目录；(3)提升标题与正文的相关性。
hive中与oracle一些看上去类似但结果不同的写法总结
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性；(3)增加条理清晰的目录。
将collect_set改成既排重又排序
沉甲: 如果想把1的结果由["a","b","h"]改成["b","a","h"]，应该怎样改呢

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。