文件副本存储策略(replication policies):将第1个副本存储在本地机架节点上;第2个存储在与第1个相同机架的另一个节点上;第3个放在不同机架的任意一个节点上。(若副本多于3个则剩下的副本随机存储在集群其他机架中。
其他:Block块设置的比较大是为了最小化寻址开销。但也不会设置太大,如果设置太大会导致任务数过少,作业运行速度就会比较慢。
2015年10月21日晚
文件副本存储策略(replication policies):将第1个副本存储在本地机架节点上;第2个存储在与第1个相同机架的另一个节点上;第3个放在不同机架的任意一个节点上。(若副本多于3个则剩下的副本随机存储在集群其他机架中。
其他:Block块设置的比较大是为了最小化寻址开销。但也不会设置太大,如果设置太大会导致任务数过少,作业运行速度就会比较慢。
2015年10月21日晚