客户端和与之交互的HDFS,namenode,datanode之间的数据流
1. 文件读取
1) 客户端调用FileSystem的open()方法打开文件,对于HDFS,是一个DistributedFileSystem的实例
2) DistributedFileSystem的实例通过RPC调用namenode,namenode根据映射关系返回存有文件块副本的datanode地址,datanode根据与客户端的距离排序(网络拓扑),如果本身也是datanode且存有文件块,则客户端从本地获取副本