修改hadoop源码后，hadoop和spark的编译过程

最新推荐文章于 2022-09-19 16:00:07 发布

amber_amber

最新推荐文章于 2022-09-19 16:00:07 发布

阅读量2.4k

点赞数

分类专栏： Hadoop学习分享 spark学习分享文章标签： hadoop2.0 spark 源码编译

本文链接：https://blog.csdn.net/amber_amber/article/details/41041787

版权

在遇到修改Hadoop源码后，Hadoop和Spark编译过程中资源管理器无法连接的问题，尝试在yarn-site.xml配置未见效。进一步检查发现需修改spark-assembly.jar内的yarn-default.xml，完成修改并重新打包后，问题得到解决，程序运行恢复正常。

摘要由CSDN通过智能技术生成

近期对hadoop2.0源码做了一些修改，根据业务需要，添加了一点小小的功能。而且我们的hadoop2.0环境上同时运行着MapReduce和spark计算框架，所以hadoop源码的修改同时涉及到了hadoop的重新编译，以及spark的重新编译。下面是对编译过程的一点记录。编译的主要难点和关键在对spark的编译。
版本：
hadoop： cdh5.1.0-hadoop2.3.0
spark： spark1.0.2

hadoop源码的编译
1. 环境准备
（1）安装maven3 。（这个过程很简单，就不描述了，只要下载maven包后解压，配置环境变量就可以了。注意版本，我的版本是apache-maven-3.1.1。）
（2）安装protobuf-2.5.0。
（3）其他需要的环境： yum install autoconf automake libtool ant gcc gcc-c++ make cmake openssl-devel ncurses-devel
2. 下载cdh5.1.0的源码包并解压：