HDFS写数据流

最新推荐文章于 2022-07-24 23:00:00 发布

vyvtan

最新推荐文章于 2022-07-24 23:00:00 发布

阅读量122

点赞数

分类专栏：大数据导论文章标签： hdfs hadoop big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vyvtan/article/details/120983278

版权

大数据导论专栏收录该内容

6 篇文章 0 订阅

订阅专栏

HDFS写数据流

1.客户端向名称节点发出写数据流的请求。

2.名称节点通过多种验证，查看新文件是否已存在系统，若存在则创建失败，不上传文件，若不存在则上传，并告知客户端写数据。

3.当客户端开始写入数据时，DFSDataOutputStream会将文件分割成包，然后放入一个内容“数据队列”中，数据流系统会将这些小的文件放入数据流中，然后DataStreamer请求名称节点为新的文件包分配合适的数据节点存放副本。返回的数据节点形成一个“管道”，管道中的数据节点将文件包以流的方式传给第一个数据节点，第一个数据节点会存储这个包，然后将它推送到第二个数据节点，依次重复操作，直到完成最后一个数据节点。

4.DFSDataOutputStream也会保存一个包的内部对列，用来等待管道中的数据节点返回确认信息，这个队列被称为“确认队列",只有当所有数据节点都返回写入成功后，才会删除。

5.最后客户端向名称节点发出结束消息，并将文件的块信息存储在名称节点中。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HDFS写数据流

HDFS写数据流1.客户端向名称节点发出写数据流的请求。2.名称节点通过多种验证，查看新文件是否已存在系统，若存在则创建失败，不上传文件，若不存在则上传，并告知客户端写数据。3.当客户端开始写入数据时，DFSDataOutputStream会将文件分割成包，然后放入一个内容“数据队列”中，数据流系统会将这些小的文件放入数据流中，然后DataStreamer请求名称节点为新的文件包分配合适的数据节点存放副本。返回的数据节点形成一个“管道”，管道中的数据节点将文件包以流的方式传给第一个数据节点...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。