Hadoop的写和读流程

本文详细介绍了Hadoop的写入和读取流程,包括数据如何经过节点分布,以及在读取时的处理步骤。同时,讨论了机架感知策略,优化了数据在集群中的通信效率。
摘要由CSDN通过智能技术生成

写流程

1.启动NN进程,提供分布式客户端
2.客户端发送写请求,NN判断是否有权限,路径是否合法
3.NN进程判断合法,返回允许上传文件
4.客户端根据文件设置大小,请求NN发送DN列表
5.NN进程根据文件副本数,根据机架感知,返回dn列表
6.客户端会请求举例最近的DN节点,再由DN列表中的每个DN节点都请求举例最近的DN节点,建立数据传输通道
7.通道建立完成,客户端将第一块的数据,封装为一个个packet,发送到通道的下一个节点
		通道的每一个DN节点在收到packet后,进行校验,检验合法,罗盘存储,将packet发送到下一个DN节点,回复客户端ack确认消息!
8.第一个块传输完成后,DN向NN上报块的消息,只要有一个DN节点上报块信息,NN就认为这个块已经传输完成,通道关闭,
开始下一个块的传输
9.下一个块依次按照④-⑧流程传输
10.所有的块传输完成后,NN响应客户端传输完成,客户端关闭输出流
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值