为了更好地理解HDFS读写流程,下面主要以漫画的形式进行的叙述。
一、HDFS写的流程
1、HDFS主要组成(主要了解hadfs构成及其担任的工作)
client:客户端(主要发起读和写),可以在javaapi操作,也可以hdfs shell中操作
namenode:全局把控
datanode:存储数据
2、数据分块
默认的情况下,客户端知道一个blocksize是多大和有几个block的副本。
客户端根据默认blocksize的大小将上传的数据进行分块,分好之后去找全局的把控者(namenode),告诉它我要进行以什么样的方式进行数据存储。
3、数据存储
datenode进行数据存储
根据客户端的请求,namenode找好存储数据的datenode,告诉客户端你往那几个datenode存储。接下来客户端就进行数据存储,存储的时候client先将数据存到第一个datenode,然后这个datenode将数据存储到下一个datenode,第二个datenode将数据存储到第三个datenode上。也
HDFS读写流程
最新推荐文章于 2024-10-15 17:18:12 发布
本文以漫画形式详细阐述了HDFS的写入和读取流程。在写流程中,客户端将数据按默认blocksize分块,通过namenode协调将数据块存储到多个datanode,最终由datanode间完成数据复制。读流程则涉及客户端从namenode获取元数据,然后直接从datanode下载所需数据。
摘要由CSDN通过智能技术生成