编译spark源码

最新推荐文章于 2019-08-03 11:18:03 发布

yzwuestc

最新推荐文章于 2019-08-03 11:18:03 发布

阅读量2.3k

点赞数 1

分类专栏： spark+scale 文章标签： scala spark

本文链接：https://blog.csdn.net/u011213451/article/details/52374706

版权

spark+scale 专栏收录该内容

0 篇文章 0 订阅

订阅专栏

编译spark源码

参考spark官方文档build spark，我这里编译的是目前最新版本spark2.0.0，使用ubuntu需要环境如下：

java
git
sbt
Intellij idea

环境准备

配置java环境这个不用说了，因为spark是用scala写的，而scala需要java的环境，配好java的环境变量。
git的环境变量可配可不配，可以用来下载spark源码包，或者直接去上面我说的build spark的里面的一个download页面下载spark源码包，记得选择source code的下载，选合适的镜像会快点，国内的网比较蛋疼。配置的原因还有在后面用sbt编译的时候会git一些东西，但是不配的话也是可以编译通过的，下载的东西没有影响。

sbt是一个scala的一种编译工具，相当于java和maven的关系。[sbt官网]

下载sbt或者不下载都是可以的，因为在spark2.0.0的源码中的build这个目录中
提供了sbt这个shell脚本，我们直接运行./build/sbt，第一次的时候就会去网上自动下载sbt的对应版本，然后开始编译，所以不配置sbt也是ok的，如果window下那么shell脚本不可以使用，所以还是要自己下载和配置环境变量。

Intellij idae是用来方便看编译以后的源码。用过eclipse但是各种问题，所以后来改用idea了，问题少一点，而且电脑不卡啊，我8g电脑i7的cpu用eclipse导入项目以后卡的一笔。[下载地址]
下载社区版本，免费使用，用来看源码够用了.