HDFS的读写流程

最新推荐文章于 2024-02-23 16:34:58 发布

帅成一匹马

最新推荐文章于 2024-02-23 16:34:58 发布

阅读量153

点赞数

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shenshengsu1990/article/details/108236471

版权

大数据专栏收录该内容

41 篇文章 1 订阅

订阅专栏

HDFS的读数据流程

1）客户端通过Distributed FileSystem向NameNode请求下载文件，
2）NameNode通过查询元数据，找到文件块所在的DataNode地址。
3）挑选一台DataNode（就近原则，然后随机）服务器，请求读取第一个 Block。
4）DataNode将第一个 Block数据传给客户端。
5）再挑选一台DataNode（根据就近原则和负载情况）服务器，请求读取第二个 Block。
6）DataNode将第二个 Block数据传给客户端。
7）客户端将两个Block数据进行拼接处理，然后写入到文件中。

HDFS的写数据流程

1）客户端首选创建一个Distributed FileSystem对象，然后通过Distributed FileSystem向NameNode请求上传文件，NameNode检查目标文件是否已存在。
2）NameNode返回是否可以上传。
3）客户端请求第一个 Block上传到哪几个DataNode服务器上。
4）NameNode返回3个DataNode节点，分别为dn1、dn2、dn3。
5）客户端通过FSDataOutputStream输出流向dn1（通过就近原则选择节点）上传数据，dn1收到请求会继续调用dn2，然后dn2调用dn3，将这个通信管道建立完成。
6）dn1、dn2、dn3逐级应答客户端。
7）客户端以Packet为单位往dn1上传第一个Block（先将数据上传到内存中，然后将内存中数据序列化到磁盘上），dn1收到一个Packet就会传给dn2（先传到内存再序列化到磁盘），dn2传给dn3（先传到内存再序列化到磁盘），等dn3每处理完一个packet就会往回应答数据已处理完成，可以删除内存中的数据，接着dn2、dn1也往回应答。
8）当一个Block传输完成之后，客户端再次请求NameNode上传第二个Block的服务器。（重复执行3-7步）。

帅成一匹马

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HDFS的读写流程

为一个大龄程序员，作为一个全栈程序员，作为一个讲课讲了N久的程序员老师，有必要给大家介绍一下成为一个月薪两万以内的小公司全栈工程师一般情况下需要掌握的技术栈。对于月薪两万，我们要做的第一件事情是把工作范围锁定在北上广深，这样全栈的技术栈才会更加清晰一些。以下所有言论只代表梦想橡皮擦个人思考，可以当真。对于软件开发工程师基本技能，必须要说一句，月薪两万以内在北京，数学水平大概初中级别就可以，英语水平同上。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。