Hadoop的单机/伪分布式/完全分布式环境的配置其实大同小异,大致可分为以下几个大步骤(我们主要以完全分布式集群的配置为例):
0、准备
a) 准备至少两台机子,linux系统
b) 安装jdk,并export相关系统环境变量,主要是JAVA_HOME和PATH
c) 下载hadoop并解压缩,并export相关系统环境变量,主要是PATH
1、修改/etc/hostname中的主机名(该步骤可省略)
假定两台分别命名为master和slave
(其中master作为NameNode, SecondaryNameNode, JobTracker, DataNode和TaskTracker;slave作为DataNode, TaskTracker)