生产环境下 Spark1.3.1 源码编译 thrift功能及碰到的问题

最新推荐文章于 2018-04-18 10:30:00 发布

chenchenrao

最新推荐文章于 2018-04-18 10:30:00 发布

阅读量623

点赞数

分类专栏： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chenchenrao/article/details/45484423

版权

spark 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

在此不再赘述hadoop环境搭建默认是搭建好了（我这里用的版本是hadoop2.2+hive0.12，所以需要自己编译）

1、下载spark源码

git clone git://github.com/apache/spark.git -b branch-1.3

2、编译spark

1) 建议使用jdk1.7编译，不建议1.6

export JAVA_HOME=/home/xxx/java1.7/jdk1.7

2) 设置maven编译选项

##export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=512M -XX:ReservedCodeCacheSize=512m" ##（视情况而定）

export MAVEN_OPTS="-Xmx4g -XX:MaxPermSize=1024M -XX:ReservedCodeCacheSize=1024m"

3）编译

mvn -Pyarn -Phadoop-2.2 -Dhadoop.version=2.2.0 -Phive -Phive-0.12.0 -Phive-thriftserver -DskipTests clean package（推荐）

这个命令会在 spark/assembly/target/scala-2.10下生成jar包

或者

./make-distribution.sh --tgz -Pyarn -Phadoop-2.2 -Dhadoop.version=2.2.0 -Phive -Phive-0.12.0 -Phive-thriftserver -DskipTests clean package

会在spark目录下生成tgz的包。

其中，jar包的生成方式，需要自己建立lib目录。

tgz的方式，需要解压，生成的spark结构简洁，没有和源码混合在一起，便于使用。

之前，我很困惑的就是源码生成jar包后，没有lib的目录，很奇怪，这里spark的官网也没有写明，浪费了不少时间，但是其实一般情况下都不用lib包的。

只是因为我在编译spark之前，已经看了一些文章若spark+hive（hive的元数据放在mysql）需要在lib中放入mysql的jar包，就因为这个，我郁闷了很久，mvn生成的包到底怎么用，现在我可以告诉你，直接在源码的目录下执行对应的指定就可以了

未完，待续。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
生产环境下 Spark1.3.1 源码编译 thrift功能及碰到的问题

在此不再赘述hadoop环境搭建默认是搭建好了（我这里用的版本是hadoop2.2+hive0.12，所以需要自己编译）1、下载spark源码git clone git://github.com/apache/spark.git -b branch-1.32、编译spark 1) 建议使用jdk1.7编译，不建议1.6 expor
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。