副本存放策略
将每个文件的数据进行分块存储,每一个数据块又保存有多个副本,这些数据块副本分布在不同的机器节点上。
在多数情况下,HDFS 默认的副本系数是 3
第一个block副本放在和client所在的node里(如果client不在集群范围内,则这第一个node是随机选取的,系统会尝试不选择那些太满或者太忙的 node)。
第二个副本放置在与第一个节点不同的机架中的 node 中(近乎随机选择,系统会尝试不选择那些太满或者太忙的 node)。
第三个副本和第二个在同一个机架,随机放在不同的 node 中。
修改副本数:
第一种方式:修改集群文件 hdfs-site.xml
<property>
<name>dfs.replication</name>