HDFS读写文件详细过程

本文详细介绍了HDFS中文件的读写过程。写文件时,客户端先向NameNode申请,NameNode检查后返回DataNode地址,客户端建立通信管道传输block。读文件时,客户端请求NameNode获取block位置,按拓扑结构排序DataNode,选择最近的节点读取数据,通过checksum验证数据完整性。整个过程涉及到NameNode、DataNode和客户端的交互。
摘要由CSDN通过智能技术生成

HDFS写文件

写文件的大致过程如下图所示:

在这里插入图片描述

HDFS写文件过程详解:

1.客户端首先会向NameNode提交写文件申请

2.NameNode检查用户权限和是否存在该目录文件等问题,决定是否可以上传

3.NameNode返回是否可以上传

4.如果NameNode返回可以上传,客户端就会向NameNode申请上传第一个block

5.NameNode根据机架感知机制和DataNode空间大小等问题,返回三个(默认)DataNode地址

6.客户端和返回的三台DataNode建立通信管道,本质是RPC调用,DN1收到请求后会调用DN2,DN2收到后会调用DN3,然后逐级返回给客户端报告管道建立完成

7.管道建立完成之后就开始第一个block的传输,是以packet(64k)为单位进行传输,DN1收到后通过管道复制给DN2,DN2复制给DN3

8.当第一个block传输完成之后DataNode会逐级返回上传完成

9.客户端收到第一个block传输完成之后,就会重复4-8进行第二个block的传输

HDFS读文件

读文件的大致过程如下图:

在这里插入图片描述

HD

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值