Hadoop启蒙-HDFS读写流程

最新推荐文章于 2024-09-07 23:36:56 发布

码农小诚

最新推荐文章于 2024-09-07 23:36:56 发布

阅读量485

点赞数 1

分类专栏：大数据 hadoop hdfs 文章标签： hadoop 大数据 hdfs 数据库 java

本文链接：https://blog.csdn.net/qq_45895388/article/details/114025410

版权

3 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

HDFS是基于谷歌的"GFS"论文的开源实现的一个分布式文件系统。

优点：

缺点：

NameNode：

DataNode：

在这里插入图片描述

客户端向nameNode申请写入文件。
nameNode校验地址是否有效、以及客户端权限等，如果允许上传，会给客户端发送响应。
客户端收到nameNode的响应后，开始准备上传文件，按128M的大小将文件切分成若干个block块，先去询问nameNode第一个block块放哪几台dataNode。
nameNode收到上传请求后，会返回三台可用的dataNode节点信息。
客户端收到dataNode的节点信息后，会与最近的一台dataNode建立pipeline连接。
第一台dataNode会继续与下一台dataNode建立连接，下一台再与下一台建立连接，整个传输通道连接建立完毕后会依次返回客户端。
客户端将第一个block发送到第一台dataNode，并以packet（64kb）为基本单位发送。
dataNode在收到packet后，会按照516B为一个chunk进行数据校验，其中512B是数据，4B是校验位。
dataNode1每收到一个packet后本地保存，然后转发给dataNode2并开始接收下一个packet，dataNode2接收完毕后再转发给dataNode3。
当一个block块传输完毕后，dataNode会给客户端发送响应，同时各个DataNode分别向nameNode汇报自己的block，然后客户端开始上传下一个block，重复3~9过程。
客户端收到所有block上传完毕后，客户端断开连接，通知NameNode文件上传完毕。

在这里插入图片描述

如果觉得文章对你有帮助的话，可以微信关注我的公众号：码农小诚
关注我的公众号更多技术文章分享，与你共同成长，回复【555】还有55本java技术书籍，免费送

关注