HDFS写数据流程

1、客户端通过调用,分布式文件系统(DistributedFileSydtem)对像中的Create()创建一个文件。DS通过PRC调用的名称节点的文件系统命名空间创建一个新文件。

2、NameNode通过验证,确保请求客户端拥有创建文件权限,新的文件不存在文件系统中。验证通过,名称节点则会创建一个新文件记录。若创建失败,则显示异常。若成功,分布式文件系统返回一个文件系统数据输出流给客户端用来写数据。

3、客户端调用FSDataOutputStream的Write()函数,向应对的文件写入数据。

4、客户端写入数据时,DFSDataOutputStream会将文件分割成包,将其放入一个内容“数据队列”中数据流系统将小文件放入数据流中,数据流的作用是请求名称节点为新的文件包分配合适的数据节点存放副本。返回的数据节点形成了一个”管道“,其中的数据集的将文件包以流的方式传给队列的第一个数据节点,依次重复操作,直到完成最后一个数据节点。

5、DFSDataOutputStream同时也会保存一个包的内部队列,用来等待“管道”中的数据节点返回确认信息,此队列称为“确认队列”。只用所有数据节点都返回写入成功的信息后,才会确认队列中删除。若数据写入失败,HDFS则首先关闭“数据流管道”,任何通知队列的文件包都会被添加到“数据队列“的前端,保证数据不会丢失。

6当客户端成功完成数据写入的操作后,调用FSDataOutputStream的Close()方法,将所有的数据块写入数据流管道中的数据节点,待成功返回,最后通过名称节点完成写入。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

mxrone

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值