spark 2.4 源码编译流程(Windows + maven)
环境准备
- maven 3.5以上
- git
- spark 源码
- scala 2.11.x
spark pom.xml 文件修改两处
- maven版本改成本机环境的版本
- scala 版本改成 本机环境的版本
在spark源码目录中打开gitbash
这里编译需要bash环境 如果直接用cmd 进行编译会报错
执行命令 mvn clean package -Pyarn -Phadoop-2.6 -Dhadoop.version=2.6.5 -DskipTests=true
hadoop 版本选择spark源码中hadoop的版本
最后等待编译完成