HDFS理解

qq_38151176

已于 2022-09-04 14:11:10 修改

阅读量1.2k

点赞数

分类专栏： # HDFS 文章标签： hadoop hdfs

于 2021-11-28 13:21:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38151176/article/details/121489419

版权

hdfs：分布式文件系统

一、HDFS文件写入和读取过程

Hadoop3.x副本结点选择：
第一个副本在Client所处的节点上。如果客户端在集群外，随机选一个。
第二个副本在另一个机架的随机一个节点。
第三个副本在第二个副本所在机架的随机节点。
HDFS写数据流程
在这里插入图片描述
1）客户端通过Distributed FileSystem模块向NameNode请求上传文件，NameNode检查目标文件是否已存在，父目录是否存在。

2）NameNode返回是否可以上传。

3）客户端请求第一个 block上传到哪几个datanode服务器上。

4）NameNode返回3个datanode节点，分别为dn1、dn2、dn3。

5）客户端通过FSDataOutputStream模块请求dn1上传数据，dn1收到请求会继续调用dn2，然后dn2调用dn3，将这个通信管道建立完成。

6）dn1、dn2、dn3逐级应答客户端。

7）客户端开始往dn1上传第一个block（先从磁盘读取数据放到一个本地内存缓存），以packet为单位，dn1收到一个packet就会传给dn2，dn2传给dn3；dn1每传一个packet会放入一个应答队列等待应答。

8）当一个block传输完成之后，客户端再次请求NameNode上传第二个block的服务器。（

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HDFS理解

hdfs：分布式文件系统hdfs跟普通的单机文件系统有区别：1、单机文件系统中存放的文件，是在一台机器的操作系统中2、hdfs的文件系统会横跨N多的机器3、单机文件系统中存放的文件，是在一台机器的磁盘上4、hdfs文件系统中存放的文件，是落在n多机器的本地单机文件系统中（hdfs是一个基于linux本地文件系统之上的文件系统）hdfs的工作机制：1、客户把一个文件存入hdfs，其实hdfs会把这个文件切块后，分散存储在N台linux机器系统中（负责存储文件块的角色：data node）<
复制链接

扫一扫

专栏目录

qq_38151176 CSDN认证博客专家 CSDN认证企业博客

码龄7年

25: 原创

52万+: 周排名

115万+: 总排名

3万+: 访问

: 等级

239: 积分

187: 粉丝

10: 获赞

0: 评论

64: 收藏

私信

关注

热门文章

分类专栏

MySQL 1篇
数据仓库 1篇
大数据开发 1篇
Hive 7篇
Spark 11篇
MapReduce 1篇
Flume 1篇
HDFS 2篇
Yarn 1篇
HBASE 2篇

最新评论

mysql在线时长统计
CSDN-Ada助手: 非常感谢博主分享关于mysql在线时长统计的技术文章。我觉得可以继续深入探讨mysql性能优化的话题，比如如何优化查询语句、如何提高数据库读写性能等方面的内容。这样的技术文章对其他用户也非常有帮助。期待博主下一篇关于mysql性能优化的博客，相信会有更多读者受益。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。