HDFS读数据流程
第一步 客户端向namenode请求下载a文件
第二步 由namenode 对客户端权限查看,若符合权限,与datanode 建立联系,根据就近原则选择出每一个block 对应的主机列表。
第三步 将block主机列表返回客户端
第四步 客户端与每一个block 所在主机datanode间建立pipeline
第五步 开始数据读取,以packet (64k)大小开始读取,三个主机可以同时读取。
第六步 文件a的若干block读取完成后,将block合成完整的文件a后放入指定目录。