HDFS的读写流程

最新推荐文章于 2024-05-04 21:05:33 发布

布莱恩特888

最新推荐文章于 2024-05-04 21:05:33 发布

阅读量237

点赞数

分类专栏： Hadoop 文章标签： hadoop hdfs 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41818801/article/details/109228188

版权

本文详细介绍了HDFS的读写流程。在写流程中，客户端通过DistributedFileSystem与NameNode交互，获取DataNode列表，按照就近原则依次将文件块上传到DataNode。在读流程中，客户端同样通过DistributedFileSystem向NameNode请求文件，然后从指定的DataNode下载文件块。

摘要由CSDN通过智能技术生成

HDFS的读写流程

HDFS写流程（上传流程）

写流程

需要的东西：要上传的文件、客户端Client、NameNode
首先，需要在客户端Client上创建一个分布式文件系统的对象（DistributedFileSystem），然后客户端申请向NameNode上传文件，NameNode会向客户端响应是否可以上传文件。(判断的标准：要申请的上传文件的目录不存在，且具有写权限)
紧接着，客户端会开一个HDFS的输出流叫做FSDataOutputStream,请求NameNode上传第一个文件块，然后NameNode会返回一个DataNode的列表（副本数）给客户端，告诉客户端可以上传的文件块的位置在哪里。
这时候，客户端采用就近原则，先与DN1建立TCP的通信通道（串行通道），紧接着和DN2、DN3建立通信通道，建立通道以后，会相应的给出应答。然后客户端就会以Packet(64KB)数据包的形式发送数据给DN1,DN1一边往磁盘缓存数据，一边同步数据到DN2、DN3中。
之后，会上传第二个文件块，与上述描述情况类似。
最后，当两个文件块的数据都上传完以后，客户端会告诉NameNode文件上传完毕，NameNode就更在元数据中更新一下元数据，整个HDFS写流程就完毕了。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。