HDFS 写数据流程
-
剖析文件写入
-
网络拓扑-节点距离计算
在 HDFS 写入数据的过程中,NameNode 会选择距、离待上传数据最近距离的 DataNode接收数据。那么这个最近距离是怎么计算的?
节点距离:两个节点到达最近的共同祖先的距离总和。(可以理解成楼上楼下邻居串门,从住户到电梯的距离为1,假如住户(n-0)要去住户(n-1)家串门,要通过电梯(机架r-1)才能到达,那么拢共走两步就到了,此时距离为2。同理要去另一栋楼朋友家里串门,从电梯到单元门(集群d1)距离也为1,以此类推,到另一个小区,再远点到另一个市)
-
机架感知(副本存储节点选择)