编译Spark2.+ 、Hadoop CDH 版本

本文档详细介绍了如何在CDH环境下编译Spark 2.1.2。首先,需要准备包括hadoop-2.5.0-cdh5.3.6在内的环境,配置Maven、JDK和Scala。接着,修改pom.xml文件以添加Cloudera依赖和调整hadoop版本。编译过程中需注意内存需求,并跳过测试进行clean package操作。最后,通过修改/make-distribution.sh脚本来加速打包过程,生成tar包。
摘要由CSDN通过智能技术生成

参考官方文档:http://spark.apache.org/docs/latest/building-spark.html

Spark2.2+移除了对hadoop2.5的支持!!!

一、 Spark-2.1.2 编译环境准备

1、hadoop-2.5.0-cdh5.3.6
2、安装并配置好Maven(本次编译使用apache maven 3.3.9)
3、 安装并配置JDK(本次编译使用jdk1.8)
4、 安装并配置Scala(本次使用scala-2.10.4)
下载spark源码 spark-2.1.2.tgz–>http://spark.apache.org/downloads.html
5、spark源码编译,按照官网来(编译spark要内存够大,1g根本后面会出现各种问题)

vi /etc/profile
export MAVEN_OPTS="-Xmx2g -XX:ReservedCodeCacheSize=512m"

二、编译过程

(1)由于本次编译的是CDH版本,在spark-2.1.0/pom.xml文件添加编译所需的cloudera软件包依赖。【注意:添加的位置】

<repository>  
  <id>cloudera-repo</id>  
  <name
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

生命不息丶折腾不止

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值