一、Hadoop 三大发行版本
1、apache
原生版本;
2、CDH
1)CDH全称是:Cloudera’s Distribution Including Apache Hadoop CDH;
Cloudera 公司发行;在apache版本的基础上进行商业化;
发布的版本仅支持64位操作系统;
2)安装方式,通过tar 包安装;下载地址为:http://archive.cloudera.com/cdh5/cdh/5/
3)通过rpm包安装;下载地址为:http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/
4)parcels 包,相当于压缩包,所有东西都封装起来;cdh4.1.2之后才支持;也是官方推荐的安装方式;缺陷是,必须用cloudera manager 进行安装;
3、HDP
HDP全称是:hortonworks data platform;
官网为:https://www.hortonworks.com/
文档比较全;
二、集群环境准备
1、机器
磁盘阵列:RAID,JOBD;
操作系统:redhat 6.x 或 centos 6.x;常用的是 redhat 6.4 或 centos 6.4
设置 IP 地址:尽可能在同一个网段,在同一个交换机/机架Rack;
主机名:bigdata-cdh01,bigdata-cdh02,bigdata-cdh03
通过cmd该主机名:
1)本次运行生效:
hostname bigdata-cdh01.ibeifeng.com
2)永久生效,需要改配置文件:
vi /etc/sysconfig/network
HOSTNAME=bigdata-cdh01.ibeifeng.com
主机名和 IP 地址映