centos7环境下hadoop-2.7.3伪分布式搭建
##1、 修改主机名称 ##
###永久生效
hostnamectl set-hostname hadoop01
2、下载解压##
将下载的hadoop-2.7.3.tar.gz解压到/usr/local目录下
3、修改配置
首先切换目录到/usr/local/hadoop-2.7.3/etc/hadoop下
cd /usr/local/hadoop-2.7.3/etc/hadoop
-
修改hadoop-env.sh中的JAVA_HOME为
export JAVA_HOME=/usr/local/jdk1.8.0_111
-
修改core-site.xml
在configuration标签中添加如下属性
<configuration>
<!-- 指定HADOOP所使用的文件系统schema(URI),HDFS的老大(NameNode)的地址 -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://hadoop01:8020</value>
</property>
<!-- 指定hadoop运行时产生文件的存储目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop-2.7.3/data</value>
</property>
</configuration>
-
修改hdfs-site.xml
dfs.replication 1
在configuration标签中添加如下属性 -
修改mapred-site.xml
mapreduce.framework.name yarn
在configuration标签中添加如下属性 -
修改yarn-site.xml
yarn.resourcemanager.hostname hadoop01 yarn.nodemanager.aux-services mapreduce_shuffle yarn.resourcemanager.webapp.address 192.168.1.105:8088 -
添加hadoop环境变量
#hadoop start
export HADOOP_INSTALL=/usr/local/hadoop-2.7.3
export PATH= P A T H : PATH: PATH:HADOOP_INSTALL/bin:$HADOOP_INSTALL/sbin
#hadoop end
执行 hadoop version
命令,则可看到当前hadoop的版本
启动hadoop
-
首先格式化
执行hdfs namenode -format
命令 -
启动hdfs
start-dfs.sh
在浏览器输入地址 http://192.168.1.105:50070访问hdfs
-
启动yarn
start-yarn.sh
在浏览器输入地址http://192.168.1.105:8088/cluster
问题记录
- 由于虚拟机后来变了ip地址yarn访问不了
解决方法:将yarn-site的ip地址改为新的ip地址192.168.0.106
重新启动yarn仍然不能访问
查询端口,发现端口还在被原来的连接占用,kill掉
重新启动yarn,端口就启动连到新的ip上了,yarn管理页面也可访问了