Day2——Hadoop伪分布式安装

Mortal୧⍤⃝

已于 2024-06-08 18:16:53 修改

阅读量764

点赞数 22

文章标签：分布式 hadoop 大数据

于 2024-06-04 22:42:23 首次发布

本文链接：https://blog.csdn.net/2303_77130695/article/details/139455329

版权

文章目录

前言
一、Hadoop伪分布式安装
二、Hadoop集群的组成

前言

Hadoop伪分布式安装在前文Hadoop单机安装基础上进行。

一、Hadoop伪分布式安装

1.Hadoop配置文件

首先修改两个配置文件，分别是core-site.xml文件和hdfs-site.xml文件，进入到hadoop目录下的etc/hadoop目录，执行下面的操作。

修改core-site.xml文件，添加内容如下：

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

修改hdfs-site.xml文件，添加内容如下：

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

value值指定了数据块的备份数量，在伪分布式模式下，因为只有一台机器，所以设置为1即可。

修改 mapred-site.xml文件，添加内容如下：

<configuration>
    <property>
       <name>mapreduce.framework.name</name>
       <value>yarn</value>
    </property>
</configuration>

修改 yarn-site.xml文件，添加内容如下：

<configuration>

<!-- Site specific YARN configuration properties -->
   <property>
       <name>yarn.nodemanager.aux-services</name>
       <value>mapreduce_shuffle</value>
   </property>
   <property>
       <name>yarn.nodemanager.env-whitelist</name>
       <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
   </property>
</configuration>

2.格式化namenode

hdfs namenode -format

格式化成功后的提示：
在这里插入图片描述

3.启动

./sbin/start-dfs.sh

启动完成后：
在这里插入图片描述

二、Hadoop集群的组成

伪分布式的hadoop集群其实就两大核心组件构成：

HDFS
MapReduce

回顾一下上面启动hadoop后我们用JDK的JPS命令看到的JAVA进程：
Alt
可以看到一共有三个东西：

secondNameNode
DataNode
NameNode

这三个东西是属于HDFS的，dataNode是具体存放数据的节点，nameNode用来记录所有dataNode的信息，secondNameNode是nameNode的备份：
在这里插入图片描述
以上是节点在HDFS维度扮演的角色，除此之外节点还在MapReduce维度扮演有角色，MapReduce在跑一个大的任务的时候会把节点分为两类：