hadoop 1.0.0.3安装与配置，绝对实用

最新推荐文章于 2024-03-31 22:39:10 发布

gaobooo

最新推荐文章于 2024-03-31 22:39:10 发布

阅读量1.9k

点赞数

分类专栏： hadoop 文章标签： hadoop java logging input mapreduce 防火墙

hadoop 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

环境：操作系统Centos 6.2 64-bit --我采用的是最小安装

VMWare虚拟机4个，计划部署分配如下：

192.168.181.121 nameNode
192.168.181.122 dataNode
192.168.181.123 dataNode
192.168.181.124 dataNode

各dataNode机器，都需要安装jdk和ssh,同时要将nameNode上安装的hadoop分发到各节点机器，位置、环境变量等尽量保持与nameNode一致。

1、安装基础工具

[java] view plain copy print ?

yum -y install wget
yum -y install make
yum -y install openssh*

	yum -y install wget
	yum -y install make
	yum -y install openssh*

2、安装JDK

将下载源码包jdk-7u4-linux-x64.tar.gz

放到目录：/usr/lib/jvm下（这里位置目录可以自己定义，JDK环境变量需要对应）

直接解压：

[java] view plain copy print ?

tar zxvf jdk-7u4-linux-x64.tar.gz

	tar zxvf jdk-7u4-linux-x64.tar.gz

3、安装hadoop-1.0.3.tar.gz

3.1、将下载包解压到根目录tar xzvf hadoop-1.0.3.tar.gz

3.2、修改hadoop-env.sh配置

[java] view plain copy print ?

vi conf/hadoop-env.sh

           
          vi conf/hadoop-env.sh

# 找到JAVA_HOME设置：

[java] view plain copy print ?

# The java implementation to use. Required.
export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_04

# The java implementation to use.  Required.
 export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_04

# 在文件末尾加以下内容：
# 取消环境变量$HADOOP_HOME过时的警告

[java] view plain copy print ?

export HADOOP_HOME_WARN_SUPPRESS=1

export HADOOP_HOME_WARN_SUPPRESS=1

4、配置环境变量(集群节点都要配置环境变量)

[java] view plain copy print ?

vi /etc/profile

	vi /etc/profile

在文件中末尾加入以下内容：

[java] view plain copy print ?

export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_04
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export HADOOP_HOME=/hadoop-1.0.3
export PATH=$PATH:$HADOOP_HOME/bin

     	export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_04
	export PATH=$JAVA_HOME/bin:$PATH
	export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
	export HADOOP_HOME=/hadoop-1.0.3
    	export PATH=$PATH:$HADOOP_HOME/bin

让环境变量生效

[java] view plain copy print ?

source /etc/profile

	source /etc/profile

5、多节点集群配置

5.1、设置conf/masters文件内容

指定masterNode，可以用IP，也可以用机器名,masters文件配置将决定哪台机器是secondaryNameNode,准确的说这个文件名起的不对，它应该叫secondaries。

[java] view plain copy print ?

vi conf/masters
192.168.181.221 # secondaryNameNode

	vi conf/masters


	192.168.181.221			# secondaryNameNode

其中192.168.181.221这个节点既是dataNode，同时也是secondaryNameNode

之前我这用的是默认的localhost，结果验证访问：http://192.168.181.221:50070/时报http-404错误，估计是域名解析的问题，网上推荐，masters和slaves文件里，使用机器名，这里我用IP。

5.2、设置conf/slaves文件内容，指定slavesNodes

[java] view plain copy print ?

vi conf/slaves
192.168.181.222 # dataNode
192.168.181.223 # dataNode
192.168.181.224 # dataNode

	vi conf/slaves

	192.168.181.222			# dataNode
	192.168.181.223			# dataNode
	192.168.181.224			# dataNode

指定哪些机器为从节点，用于存储数据块。

5.3、配置文件：conf/hdfs-site.xml

[java] view plain copy print ?

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>dfs.name.dir</name>
<value>/HadoopRun/name1,/HadoopRun/name2</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/HadoopRun/data1,/HadoopRun/data2</value>
</property>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
</configuration>

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>


<!-- Put site-specific property overrides in this file. -->


<configuration>
        <property>
                <name>dfs.name.dir</name>
                <value>/HadoopRun/name1,/HadoopRun/name2</value>
        </property>
        <property>
                <name>dfs.data.dir</name>
                <value>/HadoopRun/data1,/HadoopRun/data2</value>
        </property>
        <property>
                <name>dfs.replication</name>
                <value>3</value>
        </property>
</configuration>

配置文件参数说明：
dfs.name.dir：NameNode上的本地文件路径，用于持久存储命名空间和日志信息文件等内容。该参数可以有多个值，值之间用逗号分割，表示文件映射关系信息将会被复制到每个目录中做冗余备份。

dfs.data.dir：DataNode上的本地文件路径，用于存放文件数据块。该参数可以有多个值，值之间用逗号分割，表示文件数据块将会被复制到每个目录中做冗余备份，通常配置为不同的设备

注意：这里的name1、name2、data1、data2目录不能预先创建，hadoop格式化时会自动创建，如果预先创建反而会有问题

dfs.replication：表示文件数据块要冗余备份的数量，默认值为3

5.4、配置文件：conf/mapred-site.xml

[java] view plain copy print ?

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>192.168.181.221:9001</value>
</property>
<property>
<name>mapred.local.dir</name>
<value>/HadoopRun/var</value>
</property>
</configuration>

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>


<!-- Put site-specific property overrides in this file. -->


<configuration>
        <property>
                <name>mapred.job.tracker</name>
                <value>192.168.181.221:9001</value>
        </property>
        <property>
                <name>mapred.local.dir</name>
                <value>/HadoopRun/var</value>
        </property>


</configuration>

配置文件参数说明：
mapred.job.tracker：JobTracker（任务分配管理）的主机（或者IP）和端口

mapred.local.dir：本地文件路径，用逗号分割的路径列表，是Map/Reduce临时数据存放的地方。

5.5、配置文件：conf/core-site.xml

[java] view plain copy print ?

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://192.168.181.221:9000</value>
<description>
NameNode的URI路径，格式：hdfs://主机名:端口/
</description>
</property>
<property>
<name>fs.checkpoint.period</name>
<value>3600</value>
<description>
进行checkpoint的周期时间间隔，单位：秒
</description>
</property>
<property>
<name>fs.checkpoint.size</name>
<value>67108864</value>
<description>
日志文件达到这个上限值时，将进行一次强制checkpoint操作,单位：byte
</description>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/HadoopRun/tmp</value>
<description>
Hadoop的默认临时路径，这个最好配置，如果在新增节点或者其他情况下莫名其妙的DataNode启动不了，就删除此文件中的tmp目录即可。不过如果删除了NameNode机器的此目录，那么就需要重新执行NameNode格式化的命令。/hadoopRun/tmp这里给的路径不需要创建会自动生成。
</description>
</property>
</configuration>

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>


<!-- Put site-specific property overrides in this file. -->


<configuration>
        <property>
                <name>fs.default.name</name>
                <value>hdfs://192.168.181.221:9000</value>
		<description>
			NameNode的URI路径，格式：hdfs://主机名:端口/
  		</description>
        </property>
	<property>
                <name>fs.checkpoint.period</name>
                <value>3600</value>
		<description>
			进行checkpoint的周期时间间隔，单位：秒
  		</description>
        </property>
	<property>
                <name>fs.checkpoint.size</name>
                <value>67108864</value>
		<description>
			日志文件达到这个上限值时，将进行一次强制checkpoint操作,单位：byte  
  		</description>
        </property>
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/HadoopRun/tmp</value>
		<description>
			Hadoop的默认临时路径，这个最好配置，如果在新增节点或者其他情况下莫名其妙的DataNode启动不了，就删除此文件中的tmp目录即可。不过如果删除了NameNode机器的此目录，那么就需要重新执行NameNode格式化的命令。/hadoopRun/tmp这里给的路径不需要创建会自动生成。
  		</description>
        </property>
</configuration>

6、使用ssh公钥密钥自动登陆linux服务器

实现原理
使用一种被称为"公私钥"认证的方式来进行ssh登录. "公私钥"认证方式简单的解释是
首先在客户端上创建一对公私钥（公钥文件：~/.ssh/id_rsa.pub；私钥文件：~/.ssh/id_rsa）
然后把公钥放到服务器上（~/.ssh/authorized_keys）, 自己保留好私钥
当ssh登录时,ssh程序会发送私钥去和服务器上的公钥做匹配.如果匹配成功就可以登录了

这里nameNode服务器需要ssh无密码访问所有dataNode服务器。

6.1、在metaServer机器上生成公钥密钥对

问题：初次生成密钥时出错

[java] view plain copy print ?

[root@gifer .ssh]# ssh-keygen
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa):
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
open /root/.ssh/id_rsa failed: Permission denied.
Saving the key failed: /root/.ssh/id_rsa.

[root@gifer .ssh]# ssh-keygen
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa):
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
open /root/.ssh/id_rsa failed: Permission denied.
Saving the key failed: /root/.ssh/id_rsa.

SELINUX=enforcing问题导致密钥创建失败

[java] view plain copy print ?

vi /etc/selinux/config

vi /etc/selinux/config

[java] view plain copy print ?

SELINUX=enforcing

SELINUX=enforcing

改成

[java] view plain copy print ?

SELINUX=disabled

SELINUX=disabled

保存重启机器后，再生成。

[java] view plain copy print ?

[root@gifer /]# ssh-keygen -t rsa
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa):
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /root/.ssh/id_rsa.
Your public key has been saved in /root/.ssh/id_rsa.pub.
The key fingerprint is:
98:3c:31:5c:23:21:73:a0:a0:1f:c6:d3:c3:dc:58:32 root@gifer
The key's randomart image is:
+--[ RSA 2048]----+
|. E.=.o |
|.o = @ o . |
|. * * = |
| o o o = |
| . = S |
| . |
| |
| |
| |
+-----------------+

[root@gifer /]# ssh-keygen -t rsa
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa):
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /root/.ssh/id_rsa.
Your public key has been saved in /root/.ssh/id_rsa.pub.
The key fingerprint is:
98:3c:31:5c:23:21:73:a0:a0:1f:c6:d3:c3:dc:58:32 root@gifer
The key's randomart image is:
+--[ RSA 2048]----+
|.   E.=.o        |
|.o = @ o .       |
|. * * =          |
| o o o =         |
|  .   = S        |
|       .         |
|                 |
|                 |
|                 |
+-----------------+

成功后，目录下会多出两个文件：
私钥文件：id_raa
公钥文件：id_rsa.pub

6.2、将公钥文件id_rsa.pub内容放到authorized_keys中

将生成的公钥文件默认在/root/.ssh/目录下

[java] view plain copy print ?

[root@gifer .ssh]# cat id_rsa.pub >> authorized_keys

[root@gifer .ssh]# cat id_rsa.pub >> authorized_keys

将文件内容追加到authorized_keys文件中，如果文件authorized_keys不存在，会自动创建。

同时，将id_rsa.pub文件内容，分发一份到其它dataNode机器

[java] view plain copy print ?

[root@gifer .ssh]# ssh-copy-id -i id_rsa.pub root@192.168.181.222

[root@gifer .ssh]# ssh-copy-id -i id_rsa.pub  root@192.168.181.222

也可以使用scp命令进行复制

[java] view plain copy print ?

[root@gifer .ssh]# scp authorized_keys root@192.168.181.222:/root/.ssh/

[root@gifer .ssh]# scp authorized_keys  root@192.168.181.222:/root/.ssh/

6.3、设置权限

.ssh 文件夹权限：700
authorized_keys文件权限：600

6.5、验证ssh登录是否成功

[java] view plain copy print ?

[root@gifer .ssh]# ssh root@192.168.181.218
Last login: Mon May 21 18:24:21 2012 from 192.168.181.1

[root@gifer .ssh]# ssh root@192.168.181.218
Last login: Mon May 21 18:24:21 2012 from 192.168.181.1

表示成功

root@192.168.181.218's password: //如果还提示要输入密码，说明配置不成功，这个很可能是权限的问题

7、启动hadoop前，检查配置

7.1、将部署进行分发

使用scp命令,将弄好的hadoop-1.0.3文件夹复制一份，分发到各dataNode节点相同目录下：

[java] view plain copy print ?

[root@gifer /]# scp -r hadoop-1.0.3 192.168.181.222:/

[root@gifer /]# scp -r  hadoop-1.0.3  192.168.181.222:/

这里我当前192.168.181.221机器文件夹hadoop-1.0.3在根目录下，所以192.168.181.222上也是放根目录。scp 参数 -r 表示，如果目标目录已经存在文件，就覆盖它。否则会报错：not a regular file

如果配置做了修改，需要对更改的配置文件重新发布到各节点即可：

[java] view plain copy print ?

[root@masterNode hadoop-1.0.3]# scp -r /hadoop-1.0.3/conf 192.168.181.222:/hadoop-1.0.3/

[root@masterNode hadoop-1.0.3]# scp -r /hadoop-1.0.3/conf 192.168.181.222:/hadoop-1.0.3/

7.2、打开以下防火墙端口或关闭防火墙

图安全——开端口（所有节点机器，包括namenode）：

[java] view plain copy print ?

/sbin/iptables -I INPUT -p tcp --dport 9000 -j ACCEPT
/sbin/iptables -I INPUT -p tcp --dport 9001 -j ACCEPT
/sbin/iptables -I INPUT -p tcp --dport 37974 -j ACCEPT
/sbin/iptables -I INPUT -p tcp --dport 38840 -j ACCEPT
/sbin/iptables -I INPUT -p tcp --dport 49785 -j ACCEPT
/sbin/iptables -I INPUT -p tcp --dport 50030 -j ACCEPT
/sbin/iptables -I INPUT -p tcp --dport 50070 -j ACCEPT
/sbin/iptables -I INPUT -p tcp --dport 50090 -j ACCEPT
service iptables save

/sbin/iptables -I INPUT -p tcp --dport 9000 -j ACCEPT
/sbin/iptables -I INPUT -p tcp --dport 9001 -j ACCEPT
/sbin/iptables -I INPUT -p tcp --dport 37974 -j ACCEPT
/sbin/iptables -I INPUT -p tcp --dport 38840 -j ACCEPT
/sbin/iptables -I INPUT -p tcp --dport 49785 -j ACCEPT
/sbin/iptables -I INPUT -p tcp --dport 50030 -j ACCEPT
/sbin/iptables -I INPUT -p tcp --dport 50070 -j ACCEPT
/sbin/iptables -I INPUT -p tcp --dport 50090 -j ACCEPT
service iptables save

查看防火墙信息

[java] view plain copy print ?

service iptables status

service iptables status

图省事——关防火墙

[java] view plain copy print ?

service iptables stop

service iptables stop

8、安装启动hadoop系统

8.1、格式化一个新的分布式文件系统

[java] view plain copy print ?

[root@masterNode /]# cd hadoop-1.0.3
[root@masterNode hadoop-1.0.3]# bin/hadoop namenode -format
12/05/23 13:36:17 INFO namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG: host = localhost/127.0.0.1
STARTUP_MSG: args = [-format]
STARTUP_MSG: version = 1.0.3
STARTUP_MSG: build = https://svn.apache.org/repos/asf/hadoop/common/branches/branch-1.0 -r 1335192; compiled by 'hortonfo' on Tue May 8 20:31:25 UTC 2012
************************************************************/
Re-format filesystem in /hadoop_home/name1 ? (Y or N) y
Format aborted in /hadoop_home/name1
12/05/23 13:36:29 INFO namenode.NameNode: SHUTDOWN_MSG:
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at localhost/127.0.0.1
************************************************************/

[root@masterNode /]# cd hadoop-1.0.3
[root@masterNode hadoop-1.0.3]# bin/hadoop namenode -format
12/05/23 13:36:17 INFO namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG:   host = localhost/127.0.0.1
STARTUP_MSG:   args = [-format]
STARTUP_MSG:   version = 1.0.3
STARTUP_MSG:   build = https://svn.apache.org/repos/asf/hadoop/common/branches/branch-1.0 -r 1335192; compiled by 'hortonfo' on Tue May  8 20:31:25 UTC 2012
************************************************************/
Re-format filesystem in /hadoop_home/name1 ? (Y or N) y
Format aborted in /hadoop_home/name1
12/05/23 13:36:29 INFO namenode.NameNode: SHUTDOWN_MSG:
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at localhost/127.0.0.1
************************************************************/

看到以上输出表示格式化失败！格式化失败的原因是：我在目录/hadoop_home/下预先创建了文件夹：name1，所以出错了。这个格式化时会自动生成。

[java] view plain copy print ?

[root@masterNode hadoop-1.0.3]# bin/hadoop namenode -format
12/05/24 03:21:29 INFO namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG: host = localhost/127.0.0.1
STARTUP_MSG: args = [-format]
STARTUP_MSG: version = 1.0.3
STARTUP_MSG: build = https://svn.apache.org/repos/asf/hadoop/common/branches/branch-1.0 -r 1335192; compiled by 'hortonfo' on Tue May 8 20:31:25 UTC 2012
************************************************************/
12/05/24 03:21:29 INFO util.GSet: VM type = 64-bit
12/05/24 03:21:29 INFO util.GSet: 2% max memory = 19.33375 MB
12/05/24 03:21:29 INFO util.GSet: capacity = 2^21 = 2097152 entries
12/05/24 03:21:29 INFO util.GSet: recommended=2097152, actual=2097152
12/05/24 03:21:29 INFO namenode.FSNamesystem: fsOwner=root
12/05/24 03:21:29 INFO namenode.FSNamesystem: supergroup=supergroup
12/05/24 03:21:29 INFO namenode.FSNamesystem: isPermissionEnabled=true
12/05/24 03:21:29 INFO namenode.FSNamesystem: dfs.block.invalidate.limit=100
12/05/24 03:21:29 INFO namenode.FSNamesystem: isAccessTokenEnabled=false accessKeyUpdateInterval=0 min(s), accessTokenLifetime=0 min(s)
12/05/24 03:21:29 INFO namenode.NameNode: Caching file names occuring more than 10 times
12/05/24 03:21:30 INFO common.Storage: Image file of size 110 saved in 0 seconds.
12/05/24 03:21:30 INFO common.Storage: Storage directory /hadoop_home/name1 has been successfully formatted.
12/05/24 03:21:30 INFO common.Storage: Image file of size 110 saved in 0 seconds.
12/05/24 03:21:30 INFO common.Storage: Storage directory /hadoop_home/name2 has been successfully formatted.
12/05/24 03:21:30 INFO namenode.NameNode: SHUTDOWN_MSG:
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at localhost/127.0.0.1
************************************************************/

[root@masterNode hadoop-1.0.3]# bin/hadoop namenode -format
12/05/24 03:21:29 INFO namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG:   host = localhost/127.0.0.1
STARTUP_MSG:   args = [-format]
STARTUP_MSG:   version = 1.0.3
STARTUP_MSG:   build = https://svn.apache.org/repos/asf/hadoop/common/branches/branch-1.0 -r 1335192; compiled by 'hortonfo' on Tue May  8 20:31:25 UTC 2012
************************************************************/
12/05/24 03:21:29 INFO util.GSet: VM type       = 64-bit
12/05/24 03:21:29 INFO util.GSet: 2% max memory = 19.33375 MB
12/05/24 03:21:29 INFO util.GSet: capacity      = 2^21 = 2097152 entries
12/05/24 03:21:29 INFO util.GSet: recommended=2097152, actual=2097152
12/05/24 03:21:29 INFO namenode.FSNamesystem: fsOwner=root
12/05/24 03:21:29 INFO namenode.FSNamesystem: supergroup=supergroup
12/05/24 03:21:29 INFO namenode.FSNamesystem: isPermissionEnabled=true
12/05/24 03:21:29 INFO namenode.FSNamesystem: dfs.block.invalidate.limit=100
12/05/24 03:21:29 INFO namenode.FSNamesystem: isAccessTokenEnabled=false accessKeyUpdateInterval=0 min(s), accessTokenLifetime=0 min(s)
12/05/24 03:21:29 INFO namenode.NameNode: Caching file names occuring more than 10 times
12/05/24 03:21:30 INFO common.Storage: Image file of size 110 saved in 0 seconds.
12/05/24 03:21:30 INFO common.Storage: Storage directory /hadoop_home/name1 has been successfully formatted.
12/05/24 03:21:30 INFO common.Storage: Image file of size 110 saved in 0 seconds.
12/05/24 03:21:30 INFO common.Storage: Storage directory /hadoop_home/name2 has been successfully formatted.
12/05/24 03:21:30 INFO namenode.NameNode: SHUTDOWN_MSG:
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at localhost/127.0.0.1
************************************************************/

格式化分布式文件系统成功。

8.2、启动hadoop服务

启动hdfs守护进程

[java] view plain copy print ?

[root@masterNode hadoop-1.0.3]# bin/start-dfs.sh
starting namenode, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-namenode-masterNode.out
192.168.181.224: starting datanode, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-datanode-node3.out
192.168.181.222: starting datanode, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-datanode-node1.out
192.168.181.223: starting datanode, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-datanode-node2.out
192.168.181.221: starting secondarynamenode, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-secondarynamenode-masterNode.out

[root@masterNode hadoop-1.0.3]#  bin/start-dfs.sh    
starting namenode, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-namenode-masterNode.out
192.168.181.224: starting datanode, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-datanode-node3.out
192.168.181.222: starting datanode, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-datanode-node1.out
192.168.181.223: starting datanode, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-datanode-node2.out
192.168.181.221: starting secondarynamenode, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-secondarynamenode-masterNode.out

启动mapreduce守护进程

[java] view plain copy print ?

[root@masterNode hadoop-1.0.3]# bin/start-mapred.sh
starting jobtracker, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-jobtracker-masterNode.out
192.168.181.223: starting tasktracker, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-tasktracker-node2.out
192.168.181.222: starting tasktracker, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-tasktracker-node1.out
192.168.181.224: starting tasktracker, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-tasktracker-node3.out

[root@masterNode hadoop-1.0.3]#  bin/start-mapred.sh
starting jobtracker, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-jobtracker-masterNode.out
192.168.181.223: starting tasktracker, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-tasktracker-node2.out
192.168.181.222: starting tasktracker, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-tasktracker-node1.out
192.168.181.224: starting tasktracker, logging to /hadoop-1.0.3/libexec/../logs/hadoop-root-tasktracker-node3.out

注：对于命令bin/start-all.sh（启动所有守护进程）在hadoop-1.0.3版本中已不推荐使用了。

8.3、验证安装是否成功

使用jps命令查看启动的守护进程有哪些：

[java] view plain copy print ?

[root@masterNode hadoop-1.0.3]# jps
12275 NameNode
12445 SecondaryNameNode
12626 Jps
12529 JobTracker
[root@node3 ~]# jps
6621 DataNode
6723 TaskTracker
6819 Jps

[root@masterNode hadoop-1.0.3]# jps
12275 NameNode
12445 SecondaryNameNode
12626 Jps
12529 JobTracker


[root@node3 ~]# jps
6621 DataNode
6723 TaskTracker
6819 Jps

另外可通过浏览器访问：

NameNode http://192.168.181.221:50070/

JobTracker http://192.168.181.221:50030/

8.4、关闭hadoop服务

关闭hdfs守护进程

[java] view plain copy print ?

[root@masterNode hadoop-1.0.3]# bin/stop-dfs.sh
stopping namenode
192.168.181.222: stopping datanode
192.168.181.224: stopping datanode
192.168.181.223: stopping datanode
192.168.181.221: stopping secondarynamenode

[root@masterNode hadoop-1.0.3]#  bin/stop-dfs.sh    
stopping namenode
192.168.181.222: stopping datanode
192.168.181.224: stopping datanode
192.168.181.223: stopping datanode
192.168.181.221: stopping secondarynamenode

关闭mapreduce守护进程

[java] view plain copy print ?

[root@masterNode hadoop-1.0.3]# bin/stop-mapred.sh
stopping jobtracker
192.168.181.222: stopping tasktracker
192.168.181.224: stopping tasktracker
192.168.181.223: stopping tasktracker

[root@masterNode hadoop-1.0.3]#  bin/stop-mapred.sh
stopping jobtracker
192.168.181.222: stopping tasktracker
192.168.181.224: stopping tasktracker
192.168.181.223: stopping tasktracker

注：对于命令bin/stop-all.sh（关闭所有守护进程）在hadoop-1.0.3版本中已不推荐使用了。

8.5、文件上传测试

略……

安装过程遇到的问题：

1、想在分布式文件系统中创建一个目录input，结果报错：

[java] view plain copy print ?

[root@masterNode hadoop-1.0.3]# bin/hadoop fs -mkdir input
mkdir: org.apache.hadoop.hdfs.server.namenode.SafeModeException: Cannot create directory /user/root/input. Name node is in safe mode.

[root@masterNode hadoop-1.0.3]# bin/hadoop fs -mkdir input
mkdir: org.apache.hadoop.hdfs.server.namenode.SafeModeException: Cannot create directory /user/root/input. Name node is in safe mode.

解决办法：关闭安全模式

[java] view plain copy print ?

[root@masterNode hadoop-1.0.3]# bin/hadoop dfsadmin -safemode leave
Safe mode is OFF

[root@masterNode hadoop-1.0.3]# bin/hadoop dfsadmin -safemode leave
Safe mode is OFF

gaobooo

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop 1.0.0.3安装与配置，绝对实用

环境：操作系统Centos 6.2 64-bit --我采用的是最小安装VMWare虚拟机4个，计划部署分配如下：192.168.181.121 nameNode192.168.181.122 dataNode192.168.181.123 dataNode192.168.181.124 dataNode各dataNode机器，都需要安装jdk和ssh,同时要将name
复制链接

扫一扫

专栏目录