Hadoop伪分布式 启动HDFS&YARN运行MapReduce

本文详细介绍了在伪分布式环境下启动Hadoop HDFS、YARN并运行MapReduce的步骤,包括配置hadoop-env.sh、core-site.xml、hdfs-site.xml、yarn-env.sh、yarn-site.xml、mapred-site.xml等文件,以及格式化NameNode、启动DataNode、传输文件、启动YARN、执行MapReduce任务等操作。同时,文中还涉及了NameNode的问题、日志信息的查看、配置历史服务器和日志集群的设置。
摘要由CSDN通过智能技术生成

伪分布式

服务器配置按照完全分布式进行配置,但是只有一台服务器,所以是伪分布式
配置/opt/module/hadoop-2.7.7/etc/hadoop目录下的文件,就是对hadoop进行配置

1 启动HDFS并运行MapReduce

1.1 配置

配置hadoop-env.sh

Linux系统中获取JDK安装路径

[root@hadoop101 /]$ echo $JAVA_HOME
/opt/module/jdk1.8.0_191

进行分布式系统一定要配置JAVA_HOME否则远程访问出错
在这里插入图片描述

core-site.xml

官网配置信息

fs.defaultFS默认配置localhost,修改成hadoop101

<!-- 指定HDFS中NameNode的地址 -->
<property>
	<name>fs.defaultFS</name>
    <value>hdfs://hadoop101:9000</value>
</property>

<!-- 指定Hadoop运行时产生文件的存储目录 -->
<property>
	<name>hadoop.tmp.dir</name>
	<value>/opt/module/hadoop-2.7.7/data/tmp</value>
</property>
hdfs-site.xml

配置hdfs的备份数,默认三个节点备份一个数据,如果一个节点宕机,其他两个节点还有备份,并且重新加入一个节点进行备份保证数据可靠

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

1.2 启动集群

第一次启动时,格式化NameNode,以后就不用格式化了,集群已经稳定

bin/hdfs namenode -format

hadoop-daemon.shhadoop的守护进程,启动NameNode

sbin/hadoop-daemon.sh start namenode

启动DataNode


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值