- client初始化Distributed FileSystem,然后用DFS的read方法尝试打开待读取的文件。
- DFS向NameNode发起RPC调用,NN返回文件的数据块信息(含数据块地址)。
- DFS在得到文件块地址后,返回一个FSDataInputStream给client,用来读取数据。client调用FSDI的read函数开始读取数据。
- FSDataInputStream会连接保存此文件第一个数据块的最近的节点,将数据块从DN读到客户端。
- 当此数据块读完之后,FSDataInputStream会关闭这个连接,然后与下一个数据块最近的数据节点建立连接,并读取数据。
- 当数据读取完毕后,client会调用FSDataInputStream的close方法关闭这个输入流。
- 在读取数据的过程中,如果客户端与数据节点在通信时出现错误,则尝试连接此数据块的下一个数据节点,失败的数据节点此后不在连接。
hdfs读流程
最新推荐文章于 2024-05-10 09:00:43 发布