首先,我用的 spark 是 1.6.1,java 1.7,scala 2.10,maven 3.3.9
1、先到 apache 官网下载 spark 源码包(【敲黑板】注意,是 source code )
2、安装 java、maven、scala(可根据 java、mvn 、scala命令查看是否安装成功,jdk 最好 1.7 以上)
3、根据需要,修改 pom.xml 文件,如修改 java.version 为 1.7 等。
4、用自带的脚本进行编译
.spark/build/mvn -Dhadoop.version=2.7.1 -Phadoop-2.6 -DskipTests clean package
这里的参数可以自己选,具体可查看 http://spark.apache.org/docs/latest/building-spark.html
第一次编译需要下载很多的依赖包,时间比较长,后面不需要,也可不联网。
5、用 idea import,选中 pom.xml ,然后等待它导入完成即可。