HDFS存储原理（存储原理、fsck命令、namenode元数据、读写流程）

吗喽也是命

已于 2023-09-06 17:09:07 修改

阅读量1.0k

点赞数 2

分类专栏：大数据文章标签： hdfs hadoop 大数据

于 2023-07-24 16:52:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2202_75347029/article/details/131865322

版权

大数据专栏收录该内容

41 篇文章 7 订阅

订阅专栏

目录

一、存储原理

二、fsck命令

1.HDFS副本数量的配置

2.检查文件的副本数

三、NameNode元数据

2.fsiimage文件

将全部的edits文件，合并为最终结果，即可得到一个FSImage文件。编辑3.NameNode元数据管理维护

4.元数据合并控制参数

四、HDFS的读写流程

1.数据写入流程

2.数据读取流程

一、存储原理

分布式存储：每个服务器（节点）存储文件的一部分。

问题：文件大小不一，不利于统一管理。在遇到多个大小不等的文件需要存储时，由于文件大小不同，所分出的部分的大小也不相同。

解决：设定统一的管理单位，block块（HDFS最小的存储单位，每个256MB（可以修改））

问题：如果丢失或损坏了某个Block块呢？由于是将文件分成若干个小块分开存储，如果在还原时丢失某一个block块，可能会导致文件无法还原。block块越多，损坏的几率越大。

解决：通过多个副本（备份）解决，将备份放到其他服务器存储

二、fsck命令

1.HDFS副本数量的配置

（1）全局修改

在hdfs-site.xml中配置以下属性：

<property>

<name>dfs.replication</name>

<value>3</value>

</property>

这个属性默认是3，一般情况下，无需主动配置（除非需要设置非3的数值），如果需要自定义，需要将三台机器文件配置文件都修改。

(2) 临时修改：

hadoop fs -D dfs.replication=2 -put test.txt /tmp/

如上命令，就可以上传test.txt的时候，临时设置其副本数为2

(3)修改已存在文件：

hadoop fs -setrep [-R] 2 path

如上命令，指定path路径的内容将会被修改为2个副本存储。-R选项可选，使用-R表示对子目录也有效。

2.检查文件的副本数

hdfs fsck path [-file [-blocks [-locations]]]

fsck可以检查指定路径是否正常

-files 可以列出路径内的文件状态

-files - blocks 输出文件块报告（有几个块，多少副本）

-files -blocks -locations 输出每一个block的详情

3.block配置

对于块（block），hdfs默认设置为256MB一个。

块大小可以通过参数：

<property>

<name>dfs.blocksize</name>

<value>268435456</value> #设置为256MB

<description>设置HDFS块大小，单位是b</description>

</property>

三、NameNode元数据

1.edits文件

NameNode基于一批edits和一个fsimage文件的配合。完成整个文件系统的管理和维护。edits文件，是一个流水账文件，记录hdfs中的每一次操作，以及本次操作影响的文件及其对应的block。但是edits记录每一次HDFS操作逐渐变得越来越大，所以会存在多个edits文件确保不会有超大edits的存在保证检索性能。

但是edits文件检索有一个问题：当用户想要查看某文件内容，如/tmp/data/test.txt，就需要在全部的edits中搜索（还需要按顺序从头到尾，避免后期改名或者删除效率非常低）。

2.fsiimage文件

将全部的edits文件，合并为最终结果，即可得到一个FSImage文件。3.NameNode元数据管理维护

NameNode基于edits和FSimage的配合，完成整个文件系统文件的管理。

1.每次1对HDFS的操作，均被edits文件记录。

2.edits达到大小上限后，开启新的edits记录。

3.定期进行edits的合并操作

·如当前没有FSImage文件，将全部edits合并为第一个FSImage

·如果当前已存在FSImage文件，将全部edits和已存在的FSImage进行合并，形成新的FSImage。

4.重复123流程。

4.元数据合并控制参数

元数据的合并，是一个定时过程，基于：

·dfs.namenode.checkpoint.period，默认3600秒，即一个小时

·dfs.namenode.checkpoint.txns，默认100000，即100W事务

只要有一个达到条件就执行。

检查是否达到条件，默认60检查一次，基于：

·dfs.namenode.checkpoint.check.period，默认60秒，来决定。

合并元数据的事情是由SecondaryNameNode会通过http从NameNode拉取数据（edits和FSImage），然后合并完成后提供给NameNode使用。

四、HDFS的读写流程

1.数据写入流程

（1）客户端向NameNode发起请求.

（2）NameNode审核权限、剩余空间后，满足条件允许写入，并告知客户端写入的DataNode地址。

（3）客户端向指定的DataNode发送数据包。

（4）被写入数据的DataNode同时完成数据副本的复制工作，将其接收的数据分发给其他DataNode。

（5）如下图，DataNode1复制给DataNode2，然后基于DataNode2复制给DataNode3和DataNode4。

（6）写入完成客户端通知NameNode，NameNode做元数据记录工作。

注意：

①NameNode不负责数据写入，只负责元数据记录和权限审批。

②客户端直接向一台DataNode写数据，这个DataNode也一般是距离客户端网络距离最近的DataNode。

③数据块副本的复制工作，由DataNode之间自行完成（构建一个PipLine，按顺序复制分发）。

2.数据读取流程

（1）客户端向NameNode申请读取文件。

（2）NameNode判断客户端权限等细节后，允许读取，并返回此文件的block列表。

（3）客户端拿到block列表后自行寻找DataNode读取即可。

注意：

①数据同样不通过NameNode提供

②NameNode提供的block坑列表，会基于网络距离尽量提供客户端计算最近的

吗喽也是命

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
HDFS存储原理（存储原理、fsck命令、namenode元数据、读写流程）

edits文件，是一个流水账文件，记录hdfs中的每一次操作，以及本次操作影响的文件及其对应的block。但是edits文件检索有一个问题：当用户想要查看某文件内容，如/tmp/data/test.txt，就需要在全部的edits中搜索（还需要按顺序从头到尾，避免后期改名或者删除效率非常低）。这个属性默认是3，一般情况下，无需主动配置（除非需要设置非3的数值），如果需要自定义，需要将三台机器文件配置文件都修改。在遇到多个大小不等的文件需要存储时，由于文件大小不同，所分出的部分的大小也不相同。
复制链接

扫一扫

专栏目录

吗喽也是命

CSDN认证博客专家 CSDN认证企业博客

码龄1年

51: 原创

30万+: 周排名

8万+: 总排名

6万+: 访问

: 等级

737: 积分

91: 粉丝

126: 获赞

70: 评论

754: 收藏

私信

关注

热门文章

分类专栏

爬虫 2篇
大数据 41篇

最新评论

Hadoop集群环境配置及安装配置（详细过程包含安装包）
2401_84024576: 你的博客内容深入浅出，总是让我不再感到学习的困难，每一篇博文都是我学习的宝库。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Hadoop集群环境配置及安装配置（详细过程包含安装包）
qingtian62626: 感谢大佬，磕磕绊绊的终于搭建成功了
Hadoop集群环境配置及安装配置（详细过程包含安装包）
安卓开发top: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Hadoop集群环境配置及安装配置（详细过程包含安装包）
2401_84182222: 这篇文章是优质之作，内容充实，结构明晰，语言流畅且通俗易懂，适合广大读者阅读。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Spark_SQL函数定义（定义UDF函数、使用窗口函数）
老k不爱考: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

吗喽也是命 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。