下载Spark2.2.0源码
在Spark官网下载源码,选着Source Code下载即可(也可以git clone spark源码),下载之后的tar包传入机器对应位置解压即可。
安装Maven并配置
在环境变量里设置maven内存大小
开始编译
由于Hadoop版本使用的是2.7.3,并且需要hive支持,所以编译时需要指定版本
- 不需要打安装包编译命令
./build/mvn -Pyarn -Phadoop-2.7 -Dhadoop.version=2.7.3 -Phive -Phive-thriftserver -Dscala-2.11 -DskipTests clean package
- 需要打安装包编译命令
./dev/make-distribution.sh --name gosunSpark --tgz -Pyarn -Phadoop-2.7 -Dhadoop.version=2.7.3 -Phive -Phive-thriftserver -Dscala-2.11