一.HDFS Replica Placement policy
如果副本摆放的机制不好的话,在计算的过程当中,很大可能会数据的传输,这样对于带宽,磁盘的IO影响是很大的。
HDFS’s placement policy is to put one replica on the local machine if the writer is on a datanode, otherwise on a random datanode, another replica on a node in a different (remote) rack, and the last on a different node in the same remote rack.
HDFS的放置策略是,如果写入器位于datanode上,则将一个副本放在本地机器上,否则将放在随机datanode上,另一个副本放在不同(远程)机架上的节点上,最后一个副本放在相同远程机架上的不同节点上。
###副本摆放策略
1-本rack的一个节点上
2-本rack的另外一个节点上
3-不同rack的一个节点上
官网:This policy cuts the inter-rack write traffic whi