Hadoop伪分布式启动HDFS&YARN运行MapReduce_linux伪分布式成功启动 hdfs 和 yarn-CSDN博客

本文链接：https://blog.csdn.net/sinat_39410753/article/details/108016958

本文详细介绍了在伪分布式环境下启动Hadoop HDFS、YARN并运行MapReduce的步骤，包括配置hadoop-env.sh、core-site.xml、hdfs-site.xml、yarn-env.sh、yarn-site.xml、mapred-site.xml等文件，以及格式化NameNode、启动DataNode、传输文件、启动YARN、执行MapReduce任务等操作。同时，文中还涉及了NameNode的问题、日志信息的查看、配置历史服务器和日志集群的设置。

摘要由CSDN通过智能技术生成

伪分布式

服务器配置按照完全分布式进行配置，但是只有一台服务器，所以是伪分布式
配置/opt/module/hadoop-2.7.7/etc/hadoop目录下的文件，就是对hadoop进行配置

1 启动HDFS并运行MapReduce

1.1 配置

配置hadoop-env.sh

Linux系统中获取JDK安装路径

[root@hadoop101 /]$ echo $JAVA_HOME
/opt/module/jdk1.8.0_191

进行分布式系统一定要配置JAVA_HOME否则远程访问出错
在这里插入图片描述

core-site.xml

官网配置信息

fs.defaultFS默认配置localhost，修改成hadoop101

<!-- 指定HDFS中NameNode的地址 -->
<property>
	<name>fs.defaultFS</name>
    <value>hdfs://hadoop101:9000</value>
</property>

<!-- 指定Hadoop运行时产生文件的存储目录 -->
<property>
	<name>hadoop.tmp.dir</name>
	<value>/opt/module/hadoop-2.7.7/data/tmp</value>
</property>

hdfs-site.xml

配置hdfs的备份数，默认三个节点备份一个数据，如果一个节点宕机，其他两个节点还有备份，并且重新加入一个节点进行备份保证数据可靠

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

1.2 启动集群

第一次启动时，格式化NameNode，以后就不用格式化了，集群已经稳定

bin/hdfs namenode -format

hadoop-daemon.shhadoop的守护进程，启动NameNode

sbin/hadoop-daemon.sh start namenode

启动DataNode

Hadoop伪分布式 启动HDFS&YARN运行MapReduce

文章目录