Hadoop HDFS读写流程

最新推荐文章于 2021-08-30 09:30:16 发布

王峥jeff

最新推荐文章于 2021-08-30 09:30:16 发布

阅读量414

点赞数

分类专栏：学习分享文章标签： hadoop hdfs HDFS读写流程

本文链接：https://blog.csdn.net/qq_40825218/article/details/84258919

版权

本文详细介绍了Hadoop HDFS的读数据和写数据流程。在读取过程中，客户端通过FileSystem打开文件，NameNode返回Block位置，客户端从最近的DataNode读取数据，确保连续的流式读取。在写入过程中，客户端创建文件，NameNode分配块，DataStreamer形成流水线，通过DataNodes进行数据复制和确认。

摘要由CSDN通过智能技术生成

HDFS

读数据流程

原理图：
读取过程分析—图示：
读取过程分析—描述:
- 1.客户端或者用户通过调用FileSystem对象的open()方法打开需要读取的文件，这对HDFS来说就是常见的一个分布式文件系统的一个读取实例
- FileSystem通过远程协议调用NameNode确定文件的前几个Block的位置。对于每一个Block，NameNode返回一个含有该Block拷贝的元数据，即文件基本信息；接下来，DataNode按照上文定义的距离值进行排序，如果Client本身就是一个DataNode，那么优先从本地DataNode节点读取数据。HDFS示例做完以上工作后，返回一个FSDataInputStream给客户端，让其从FSDataInputStream中读取数据。FSDataInputStream接着包装一个DFSInputStream，用来管理DataNode和NameNode的I/O
- NameNode向客户端返回一个包含数据信息的地址，客户端根据地址创建一个FSDataInputStream开始对数据进行读取
- FSDataInputStream根据开始时存放的前几个Blocks的DataNode的地址&#

最低0.47元/天解锁文章

王峥jeff

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hadoop HDFS读写流程

HDFS读数据流程原理图：读取过程分析—图示：读取过程分析—描述:1.客户端或者用户通过调用FileSystem对象的open()方法打开需要读取的文件，这对HDFS来说就是常见的一个分布式文件系统的一个读取实例FileSystem通过远程协议调用NameNode确定文件的前几个Block的位置。对于每一个Block，NameNode返回一个含有该Block拷贝...
复制链接

扫一扫