HDFS写数据流程

本文详细介绍了分布式文件系统中的一次写多次读取模式。客户端首先通过RPC调用名称节点创建文件,经过权限验证后,开始写入数据。数据被分割为多个块,并写入冗余数据块以确保容错性。完成写入后,客户端通过名称节点确认,最终完成文件写入操作。该模式确保了高可用性和数据完整性。
摘要由CSDN通过智能技术生成

#对文件操作采用(一次写多次读取模式)

1.客户端通过调用分布式文件系统行对象的create()创建一个文件然后分布式文件系统会通过RPC调用的名称节点中的文件系统命名空间接着创建一个新文件。

2.名称节点通过多种验证,确认客户端权限和没有相同的文件后,名称节点创建一个新的文件记录。失败的话会显示IOException异常。如果成功的话返回文件系统数据输出流给客户端用来写数据。

3.客户端调用文件系统数据输出流的write()函数,向对应的文件写入数据。

4.当客户端写入数据时分布式文件系统会将文件分割成一个一个的数据块(默认大小是64mb),然后放入一个内容数据队列中,然后数据流系统会将这些小的文件放入数据流中,注意的是写数据时会写冗余数据,冗余数据块的个数默认三个。

5.当客户端成功完成数据写入的操作后(冗余数据块全部写完)并等待确认返回成功,最后通过名称节点完成写入。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值