hadoop-2.6.0-cdh5.14.0重新编译
1、为什么重新编译
首先解释为什么要用CDH版本
现在Apache对hadoop的更新迭代很快,但对生态圈中其他框架并不一定兼容,学习试验还是可以用的,但是在实际生产环境没法用。
所以:我们使用CDH版本
CDH是美国一家大数据公司cloudera在apache开源hadoop的版本上,通过自己公司内部的各种补丁,实现版本之间的稳定运行,大数据生态圈的各个版本的软件都提供了对应的版本,解决了版本的升级困难,版本兼容性等各种问题
但是:你从官网上下载的cdh.tar包里面没有提供带C程序访问的接口,所以我们在使用本地库(本地库可以用来做压缩,以及支持C程序等等)的时候就会出问题
比如snappy。
2、重新编译
(1)准备一台linux,内存4g,硬盘40g以上,本次使用的是Centos6.9 64位操作系统(注意一定是得64位,要不白编译了)
(2)虚拟机联网,关闭防火墙,关闭selinux 虚拟机联网就不写了,贴图太多。。。 关闭防火墙
service iptables stop
chkconfig iptables off
- 关闭selinux
vim /etc/selinux/config
(3)安装jdk1.7
注意:只能用1.7 用1.8就会报错
- 查看linux中自带的openjdk
rpm -qa | grep java
- 全部卸载调
rpm -e ....
- 上传jdk安装包 解压缩
tar -zxvf jdk-7u75-linux-x64.tar.gz -C ../server
- 配置环境变量