大数据集群平台搭建--Hadoop分布式文件系统

最新推荐文章于 2024-09-27 10:47:12 发布

小伍_Five

最新推荐文章于 2024-09-27 10:47:12 发布

阅读量121

点赞数 3

文章标签：大数据 hadoop 分布式

本文链接：https://blog.csdn.net/m0_74070923/article/details/133917395

版权

Hadoop分布式文件系统

文章目录

Hadoop分布式文件系统
4.1 hadoop概述
4.2 hadoop安装
4.3 hadoop集群配置
4.4 HDFS系统
4.5 hadoop应用

4.1 hadoop概述

在这里插入图片描述
HDFS:存储
MapReduce:计算

元数据

4.2 hadoop安装

在这里插入图片描述

运行结果并不会直接展现，需要在存入的新文件中查看
即mytestout(本文中【自己创建为准】)
用cd命令进入文件位置
ls 命令查看为如下：
结果就在part-r-00000中
用cat命令即可查看
在这里插入图片描述

4.3 hadoop集群配置

在hadoop-2.7.3 位置下有 etc/hadoop 位置
cd etc/hadoop 进入

1.vi hadoop-env.sh
在这里插入图片描述

2.vi core-site.xml

<property>
<name>fs.default.name</name>
<value>hdfs://master:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/hadoop/hadoop-2.7.3/hdfs/tmp</value>
</property>
<property>
<name>io.file.buffer.size</name>
<value>131072</value>
</property>
<property>
<name>fs.checkpoint.period</name>
<value>60</value>
</property>
<property>
<name>fs.checkpoint.size</name>
<value>67108864</value>
</property>

在这里插入图片描述

注意：有时9001被占用，换其他节点试试
（否则jps无法看到Secondnode，namenode或datanode进程）
在这里插入图片描述

3.vi yarn-site.xml (8部分【第1,7,8部分必需要】

<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
<property>     
<name>yarn.resourcemanager.address</name>
<value>master:18040</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>master:18030</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>master:18088</value>
</property>
<property>
<name>yarn.resourcemanager-tracker.address</name>
<value>master:18025</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address</name>
<value>master:18141</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>

vi slaves
vi master [在 hadoop-2.7.3/etc/hadoop]

slaves 内容：
 slave1  slave2  masterbak
master 内容：
master

4.vi hdfs-site.xml

<property>
<name>dfs.replication</name>  #Block副本数，默认3
<value>2</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/hadoop/hadoop-2.7.3/hdfs/name</value>
<final>true</final>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/hadoop/hadoop-2.7.3/hdfs/data</value>
<final>true</final>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>master:9001</value>
</property>
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>