hadoop2.0.4安装

最新推荐文章于 2022-03-11 17:25:51 发布

myrainblues

最新推荐文章于 2022-03-11 17:25:51 发布

阅读量981

点赞数

分类专栏： hadoop

hadoop 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

转载自：http://f.dataguru.cn/thread-156841-1-1.html

之前，hadoop2.04测试环境搭建成功了一半，估计是由于参考文档都是按1.0配置有关。今天狠下心参照英文说明进行2.05版本的安装。

1：规划
centOS6.4上搭建hadoop2.05环境，java版本7UP21
192.168.100.171 linux1 (namenode)
192.168.100.172 linux2 (预留当namenode)
192.168.100.173 linux3 (datanode)
192.168.100.174 linux4 (datanode)
192.168.100.175 linux5 (datanode)

2：创建VMware Workstation样板机
a：安装centOS6.4虚拟机linux1，开通ssh服务,屏蔽iptables服务
[root@linux1 ~]# chkconfig sshd on
[root@linux1 ~]# chkconfig iptables off
[root@linux1 ~]# chkconfig ip6tables off
[root@linux1 ~]# chkconfig postfix off

b：关闭虚拟机linux1，增加一个新的硬盘到共享目录作为共享硬盘用（使用SCSI1:0接口)，
修改linux1.vmx，添加和修改参数:
disk.locking="FALSE"
diskLib.dataCacheMaxSize = "0"
disk.EnableUUID = "TRUE"
scsi1.present = "TRUE"
scsi1.sharedBus = "Virtual"
scsi1.virtualDev = "lsilogic"

c：重启虚拟机linux1，下载JAVA到共享硬盘，安装JAVA，在环境变量配置文件/etc/profile末尾增加：
JAVA_HOME=/usr/java/jdk1.7.0_21; export JAVA_HOME
JRE_HOME=/usr/java/jdk1.7.0_21/jre; export JRE_HOME
CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jar; export CLASSPATH
PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH; export PATH
************************************************************************
为了方便，配置hadoop环境变量到/etc/profile或hadoop用户~/.bashrc
export HADOOP_PREFIX=/app/hadoop205
export PATH=$PATH:$HADOOP_PREFIX/bin
export PATH=$PATH:$HADOOP_PREFIX/sbin
export HADOOP_MAPRED_HOME=${HADOOP_PREFIX}
export HADOOP_COMMON_HOME=${HADOOP_PREFIX}
export HADOOP_HDFS_HOME=${HADOOP_PREFIX}
export YARN_HOME=${HADOOP_PREFIX}
************************************************************************

d：修改/etc/hosts，增加：
192.168.100.171 linux1
192.168.100.172 linux2
192.168.100.173 linux3
192.168.100.174 linux4
192.168.100.175 linux5

e：修改/etc/sysconfig/selinux
SELINUX=disabled

f：增加hadoop用户及安装hadoop文件：
[root@linux1 ~]# useradd hadoop -g root
[root@linux1 ~]# passwd hadoop
[root@linux1 ~]# cd /
[root@linux1 /]# mkdir /app
[root@linux1 /]# cd /app
[root@linux1 app]# tar -zxf /mnt/mysoft/LinuxSoft/hadoop-2.0.5-alpha.tar.gz
[root@linux1 app]# mv hadoop-2.0.5-alpha hadoop205
[root@linux1 app]# chown hadoop:root -R /app/hadoop205
[root@linux1 hadoop205]# su - hadoop
[hadoop@linux1 ~]$ cd /app/hadoop205
[hadoop@linux1 hadoop205]$ mkdir mytmp
[hadoop@linux1 hadoop205]$ mkdir mydata
[hadoop@linux1 hadoop205]$ cd mydata
[hadoop@linux1 mydata]$ mkdir name
[hadoop@linux1 mydata]$ mkdir data

g：修改hadoop相关配置文件：

[hadoop@linux1 hadoop205]$ cd etc/hadoop
[hadoop@linux1 hadoop]$ vi core-site.xml
******************************************************************************
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://linux1:9000</value>
</property>
<property>
<name>io.file.buffer.size</name>
<value>131072</value>
</property>
</configuration>
******************************************************************************

[hadoop@linux1 hadoop]$ vi hdfs-site.xml
******************************************************************************
<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/app/hadoop205/mydata/name</value>
</property>

<property>
<name>dfs.blocksize</name>
<value>268435456</value>
</property>

<property>
<name>dfs.namenode.handler.count</name>
<value>100</value>
</property>

<property>
<name>dfs.datanode.data.dir</name>
<value>file:/app/hadoop205/mydata/data</value>
</property>
</configuration>
******************************************************************************

[hadoop@linux1 hadoop]$ vi yarn-site.xml
******************************************************************************
<configuration>
<property>
<name>yarn.resourcemanager.address</name>
<value>linux1:8080</value>
</property>

<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>linux1:8081</value>
</property>

<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>linux1:8082</value>
</property>

<property>
<name>yarn.resourcemanager.admin.address</name>
<value>linux1:8083</value>
</property>

<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>linux1:8084</value>
</property>

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce.shuffle</value>
</property>

<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
</configuration>
******************************************************************************

[hadoop@linux1 hadoop]$ vi mapred-site.xml
******************************************************************************
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

<property>
<name>mapreduce.map.memory.mb</name>
<value>1536</value>
</property>

<property>
<name>mapreduce.map.java.opts</name>
<value>-Xmx1024M</value>
</property>

<property>
<name>mapreduce.reduce.memory.mb</name>
<value>3072</value>
</property>

<property>
<name>mapreduce.reduce.java.opts</name>
<value>-Xmx2560M</value>
</property>

<property>
<name>mapreduce.task.io.sort.mb</name>
<value>512</value>
</property>

<property>
<name>mapreduce.task.io.sort.factor</name>
<value>100</value>
</property>

<property>
<name>mapreduce.reduce.shuffle.parallelcopies</name>
<value>50</value>
</property>

<property>
<name>mapreduce.job.tracker</name>
<value>hdfs://linux1:9001</value>
<final>true</final>
</property>
</configuration>
******************************************************************************

[hadoop@linux1 hadoop]$ vi hadoop-env.sh
******************************************************************************
export JAVA_HOME=/usr/java/jdk1.7.0_21
export HADOOP_FREFIX=/app/hadoop205
export HADOOP_COMMON_HOME=${HADOOP_FREFIX}
export HADOOP_HDFS_HOME=${HADOOP_FREFIX}
export PATH=$PATH:$HADOOP_FREFIX/bin
export PATH=$PATH:$HADOOP_FREFIX/sbin
export HADOOP_MAPRED_HOME=${HADOOP_FREFIX}
export YARN_HOME=${HADOOP_FREFIX}
export HADOOP_CONF_HOME=${HADOOP_FREFIX}/etc/hadoop
export YARN_CONF_DIR=${HADOOP_FREFIX}/etc/hadoop
******************************************************************************

[hadoop@linux1 hadoop]$ vi yarn-env.sh
******************************************************************************
export JAVA_HOME=/usr/java/jdk1.7.0_21
export HADOOP_FREFIX=/app/hadoop205
export HADOOP_COMMON_HOME=${HADOOP_FREFIX}
export HADOOP_HDFS_HOME=${HADOOP_FREFIX}
export PATH=$PATH:$HADOOP_FREFIX/bin
export PATH=$PATH:$HADOOP_FREFIX/sbin
export HADOOP_MAPRED_HOME=${HADOOP_FREFIX}
export YARN_HOME=${HADOOP_FREFIX}
export HADOOP_CONF_HOME=${HADOOP_FREFIX}/etc/hadoop
export YARN_CONF_DIR=${HADOOP_FREFIX}/etc/hadoop
******************************************************************************

h：配置ssh使用证书验证/etc/ssh/sshd_config，打开注释：
RSAAuthentication yes
PubkeyAuthentication yes
AuthorizedKeysFile .ssh/authorized_keys

3：配置ssh
a：关闭样板机，分别复制成linux2、linux3、linux4、linux5：
修改vmware workstation配置文件的displayname；
修改虚拟机的下列文件中相关的信息
/etc/udev/rules.d/70-persistent-net.rules
/etc/sysconfig/network
/etc/sysconfig/network-scripts/ifcfg-eth0

b：启动linux1、linux2、linux3、linux4、linux5，确保相互之间能ping通。

c：配置ssh，确保linux1能无验证访问其他节点
[root@linux1 tmp]# su - hadoop
[hadoop@linux1 ~]$ ssh-keygen -t rsa
Generating public/private rsa key pair.
Enter file in which to save the key (/home/hadoop/.ssh/id_rsa):
Created directory '/home/hadoop/.ssh'.
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /home/hadoop/.ssh/id_rsa.
Your public key has been saved in /home/hadoop/.ssh/id_rsa.pub.
The key fingerprint is:
17:37:98:fa:7e:5c:e4:8b:b4:7e

59:28:8f:45:bd hadoop@linux1
The key's randomart image is:
+--[ RSA 2048]----+
|                |
|          o    |
|       + o |
|       . o ... |
|       S .  o. .|
|       o  ..o..|
|       .o.+oE.|
|       .  ==oo |
|       .oo.=o |
+-----------------+
[hadoop@linux1 ~]$ ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@linux1
[hadoop@linux1 ~]$ ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@linux2
[hadoop@linux1 ~]$ ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@linux3
[hadoop@linux1 ~]$ ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@linux4
[hadoop@linux1 ~]$ ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@linux5

验证可否无密码访问：
[hadoop@linux1 ~]$ ssh linux1 date
[hadoop@linux1 ~]$ ssh linux2 date
[hadoop@linux1 ~]$ ssh linux3 date
[hadoop@linux1 ~]$ ssh linux4 date
[hadoop@linux1 ~]$ ssh linux5 date

4：初始化hadoop
[hadoop@linux1 hadoop205]$ /app/hadoop205/bin/hdfs namenode -format

5：配置linux1的slaves
[hadoop@linux1 hadoop205]$ vi etc/hadoop/slaves
192.168.100.173
192.168.100.174
192.168.100.175

6：启动hadoop
[hadoop@linux1 hadoop205]$ /app/hadoop205/sbin/start-all.sh
This script is Deprecated. Instead use start-dfs.sh and start-yarn.sh
13/06/11 10:08:28 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java

classes where applicable
Starting namenodes on [linux1]
linux1: starting namenode, logging to /app/hadoop205/logs/hadoop-hadoop-namenode-linux1.out
192.168.100.174: starting datanode, logging to /app/hadoop205/logs/hadoop-hadoop-datanode-linux4.out
192.168.100.175: starting datanode, logging to /app/hadoop205/logs/hadoop-hadoop-datanode-linux5.out
192.168.100.173: starting datanode, logging to /app/hadoop205/logs/hadoop-hadoop-datanode-linux3.out
Starting secondary namenodes [0.0.0.0]
0.0.0.0: starting secondarynamenode, logging to /app/hadoop205/logs/hadoop-hadoop-secondarynamenode-linux1.out
13/06/11 10:08:50 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java

classes where applicable
starting yarn daemons
starting resourcemanager, logging to /app/hadoop205/logs/yarn-hadoop-resourcemanager-linux1.out
192.168.100.174: starting nodemanager, logging to /app/hadoop205/logs/yarn-hadoop-nodemanager-linux4.out
192.168.100.175: starting nodemanager, logging to /app/hadoop205/logs/yarn-hadoop-nodemanager-linux5.out
192.168.100.173: starting nodemanager, logging to /app/hadoop205/logs/yarn-hadoop-nodemanager-linux3.out

7：访问地址
NameNode http://linux1:50070/
ResourceManager http://linux1:8084/
MapReduce JobHistory Server http://linux1:19888/ （没设置）