HDFS写数据流

 HDFS写数据流

1.客户端向名称节点发出写数据流的请求。

2.名称节点通过多种验证,查看新文件是否已存在系统,若存在则创建失败,不上传文件,若不存在则上传,并告知客户端写数据。

3.当客户端开始写入数据时,DFSDataOutputStream会将文件分割成包,然后放入一个内容“数据队列”中,数据流系统会将这些小的文件放入数据流中,然后DataStreamer请求名称节点为新的文件包分配合适的数据节点存放副本。返回的数据节点形成一个“管道”,管道中的数据节点将文件包以流的方式传给第一个数据节点,第一个数据节点会存储这个包,然后将它推送到第二个数据节点,依次重复操作,直到完成最后一个数据节点。

4.DFSDataOutputStream也会保存一个包的内部对列,用来等待管道中的数据节点返回确认信息,这个队列被称为“确认队列",只有当所有数据节点都返回写入成功后,才会删除。

5.最后客户端向名称节点发出结束消息,并将文件的块信息存储在名称节点中。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值