HDFS存储机制

本文详细介绍了HDFS的存储机制,包括数据以block为基本单元存储,写文件流程涉及client、NN和DN之间的交互,以及读文件流程。此外,还探讨了HDFS的容错机制,如DN心跳检测、数据完整性校验和DN故障处理。同时,解释了Secondary NameNode在管理FSImage和Edits文件中的作用,以及其与NameNode的交互过程。
摘要由CSDN通过智能技术生成

1.hdfs是如何存储数据的呢?

众所周知,hdfs分为namenode & datanode,NN 复制集群的元数据管理,DN的管理等

hdfs存储的基本单元是block

 

2.hdfs写文件流程

1.由client 发起写请求给NN, 返回DN(经过排序)及副本数;

2.写入数据块到最近的DN;

3. 第一个DN会同步数据到其它的DN 进行数据的冗余备份;

4. 循环3 直到写完所有的数据块;

5. DN 复制完成后,会告知NN,此时更新NN的数据块表,及DN表,持久化元信息;

整个过程如下图的小图1所示:

笔者画的process on 地址:

https://www.processon.com/view/link/5f3de2e0f346fb06decec33f

3.hdfs 读文件流程

HDfs一次写入多次读取,能支持高访问量。

读文件的过程

1.通过文件名请求NN获取文件的数据块信息;

2.NN返回数据块的信息,a列是数据块,b列是DN的位置信息;

3.遍历NN返回的数据块列表,从距离最近的DN开始读取数据;

如上图中的小图2所示</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值