1 下载解压
$ wget http://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.7.3/hadoop-2.7.3-src.tar.gz
$ tar -zxvf hadoop-2.7.3/hadoop-2.7.3-src.tar.gz
2 安装依赖
在hadoop的根目录下有一个BUILDING.txt文件,该文件列出了当前hadoop版本所有的必选依赖包以及可选依赖包,以及安装这些依赖包的apt-get指令。其中jdk以及maven的安装,之前博客有介绍如何安装。现在只需使用如下指令安装其余的依赖包:
$ sudo apt-get -y install build-essential autoconf automake libtool cmake zlib1g-dev pkg-config libssl-dev
$ sudo apt-get -y install libprotobuf-dev protobuf-compiler
3 编译hadoop
之前提到的BUILDING.txt文件中也有使用maven编译hadoop的指令建议,这里使用如下指令进行编译:
$ mvn package -Pdist,native -DskipTests -Dtar
需要注意的是: