HDFS读写流程

最新推荐文章于 2024-07-21 16:17:25 发布

芒果布丁加buffer

最新推荐文章于 2024-07-21 16:17:25 发布

阅读量86

点赞数

分类专栏： Hadoop 文章标签：大数据 hdfs

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/S_Alisa/article/details/125461482

版权

Hadoop 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

写流程

1.客户端通过 Distributed FileSystem 模块向 NameNode 请求上传文件， NameNode检查用户是否有写入权限并且检查目标文件是否已存在，父目录是否存在。 2.Namenode返回客户端是否可以上传。
3.如果可以上传客户端请求第一个 Block 上传到哪几个 DataNode 服务器上。
4.NameNode根据副本放置策略返回一个有序的 DataNode列表，分别为 dn1、 dn2、 dn3。
5.客户端通过 FSDataOutputStream 模块请求 dn1 上传数据， dn1收到请求会继续调用dn2，然后 dn2 调用 dn3，将这个通信管道（Pipeline）建立完成（是dn1找dn2,dn2找dn3，不是客户端与dn1、dn2、dn3都建立连接）。
6.dn1、 dn2、 dn3 逐级应答客户端。
7.客户端与DataNode建立数据传输流，将数据进行分割Packet(64KB),并使用chunk(512B)+chuncksum(4B) 填充Packet，dn1 收到一个 Packet 向内存存一份，向磁盘存一份，dn1接收完第一个Packet就会传给 dn2， dn2 传给 dn3；当dn1向dn2传送第一个Packet的同时客户端向dn1传输第二个Packet。--将数据进行分割是为了节省数据传输时间
当一个 Block 传输完成之后，DateNode各自向NameNode汇报，同时客户端再次请求 NameNode 上传第二个 Block 的服务器。（重复执行 3-7 步）

如果传输过程中dn3节点宕机，不影响数据传输；如果dn2节点宕机，dn1将数据传输给dn3；如果dn1宕机，客户端与dn2建立通信；DateNode与Namenode通过心跳机制汇报block块位置，发现副本数不足，会让其中一个DateNode复制出一个DateNode。

NameNode中记录的元数据是DateNode通过心跳机制汇报的，并不是客户端标记的。

读流程

1.客户端向 NameNode 发起 RPC 请求，来确定请求文件 block 所在的位置；
2.NameNode 检查用户权限以及是否有这个文件，返回DataNode地址；
3.客户端根据就近原则从 DataNode 来读取 block.，由DateNode返回数据；
4.当读完列表的 block 后，若文件读取还没有结束，客户端会继续向 NameNode 获取下一批的 block 列表；
5.读取完一个 block 都会进行 checksum 验证，如果读取 DataNode 时出现错误，客户端会通知 NameNode，然后再从下一个拥有该 block 副本的 DataNode 继续读。
6.最终读取来所有的 block 会合并成一个完整的最终文件

read 方法是并行的读取 block 信息，不是一块一块的读取；NameNode 只是返回 Client 请求包含块的 DataNode 地址，并不是返回请求块的数据；

芒果布丁加buffer

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
HDFS读写流程

1.客户端通过 Distributed FileSystem 模块向 NameNode 请求上传文件， NameNode检查用户是否有写入权限并且检查目标文件是否已存在，父目录是否存在。 2.Namenode返回客户端是否可以上传。3.如果可以上传客户端请求第一个 Block 上传到哪几个 DataNode 服务器上。4.NameNode根据副本放置策略返回一个有序的 DataNode列表，分别为 dn1、 dn2、 dn3。5.客
复制链接

扫一扫

专栏目录

芒果布丁加buffer CSDN认证博客专家 CSDN认证企业博客

码龄3年

9: 原创

112万+: 周排名

103万+: 总排名

1万+: 访问

: 等级

95: 积分

3: 粉丝

2: 获赞

4: 评论

31: 收藏

私信

关注

热门文章

分类专栏

sql 1篇
VNC 2篇
Hadoop 3篇
Linux 3篇

最新评论

怎么在linux上安装vnc
芒果布丁加buffer: vnc桌面蓝屏不显示 VNCSconnST: Server default pixel fromat depth 24 (32bpp) little-endian rgb888 VNCSconnST: Client pixel format depth 6 (8bpp) rgb222 VNCSconnST: Client pixel format depth 24 (32bpp) little-endian rgp888 原因是没有安装GUI服务执行yum groupinstall -y "Server with GUI"
Hadoop伪分布式搭建
大家一起学编程（python）: 感谢博主的分享！
Hadoop伪分布式搭建
彼方: 好文，已收藏，文章写得很好，初来乍到，希望多多关注，欢迎回访我的博客

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。