spark-2.4.2-bin-2.6.0-cdh5.13.0 源码编译

1.下载

2.设置CDH附加仓库地址 和镜像加速

  • .m2/setting.xml新增仓库地址
         <repository>
           <id>cloudera</id>
           <url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>
        </repository>
        
 <mirror>
	<id>alimaven</id>
	<name>aliyun maven</name>
	<url>http://maven.aliyun.com/nexus/content/groups/public/</url>
	<mirrorOf>central</mirrorOf>
</mirror>

3.编译

3.1.环境准备

  • jdk > = 1.8,安装略
  • 配置maven >
vim /etc/profile.d/maven.sh 
MAVEN_HOME=/usr/local/maven
export PATH=$MAVEN_HOME/bin:$PATH

3.2.[非必要] 根据需求修改scala版本

  • Spark-2.4.2 默认 scala版本是2.12
./dev/change-scala-version.sh  2.12
  • Spark-2.4.2 修改为2.11.x
./dev/change-scala-version.sh  2.11 

3.3.源码编译

  • 支持 hive,yarn编译
./dev/make-distribution.sh --name 2.6.0-cdh5.13.0  --tgz  -Phadoop-2.6 -Phive -Phive-thriftserver  -Pyarn  -Dhadoop.version=2.6.0-cdh5.13.0
  • 支持 hive,yarn,k8s,mesos编译
./dev/make-distribution.sh --name 2.6.0-cdh5.13.0 --pip --r --tgz -Psparkr -Phadoop-2.6 -Dhadoop.version=2.6.0-cdh5.13.0 -Phive -Phive-thriftserver -Pyarn -Pmesos -Pkubernetes
  • 编译结束后会看pom.xml所在的目录有对应的jar
    在这里插入图片描述

4.问题解决

4.1scala版本错配

  • 报错
java.io.InvalidClassException: 
org.apache.commons.lang3.time.FastDateParser; local class incompatible: 
stream classdesc serialVersionUID = 2, local class serialVersionUID = 3

  • 问题:编译时scala版本和部署环境scala版本不一致
  • 解决:保持二者版本一致

5.参考文档

  • http://www.louisvv.com/archives/1775.html
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值