spark编译与onyarn的运行

本文详细介绍了Spark on YARN的执行流程,从源代码编译到通过Yarn运行示例程序。首先,通过设置http代理和指定Hadoop版本进行源代码编译,然后修改`make-distribution.sh`将示例程序打包进tar.gz。接着,配置YARN环境变量并运行示例程序。最后,讨论了如何通过Java程序执行Spark on YARN,并列举了一些关键的系统属性配置。
摘要由CSDN通过智能技术生成

Spark on yarn执行流程源代码分析

目前的分析主要基于spark0.9.0cdh5的版本进行分析,

源代码下载地址:https://github.com/cloudera/spark.git

下载方式:gitclone url ./spark

进入spark目录,执行gitcheckout cdh5-0.9.0_5.0.0



源代码编译

使用sbt编译spark

运行sbt命令需要使用http代理,不然连接不上网络,进入sbt/目录,使用vimsbt修改里面的内容,

在最下面java命令的第二行添加-Dhttp.proxyHost=myserver-Dhttp.proxyPort=port \

运行如下命令编译spark

SPARK_HADOOP_VERSION=2.3.0-cdh5.0.0SPARK_YARN=true sbt/sbt assembly

SPARK_HADOOP_VERSION后是hadoop的版本号,


SPARK_HADOOP_VERSION=2.2.0sbt/sbt assembly

Inaddition, if you wish to run Spark on YARN,set SPARK_YARN to true:

SPARK_HADOOP_VERSION=2.0.5-alphaSPARK_YARN=true sbt/sbt assembly

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值