副本的存放策略:
1、数据的安全
2、数据块的负载均衡
这种方案不是一种最完美的方案
两个问题:
1、概念:
给一个数据块的多个副本选取合适的存储节点,来保障数据块的安全
是说将一个数据块的三个副本放在三个不同的节点,而不是将一个文件的多个不同的数据块放在不同的节点。
2、具体实现:
不同机架
不同机房
不同地域
不同的地域已经是不同的数据中心了
备份:保证数据安全
北京的数据中心和上海的数据中心
实际情况中:存储的数据是一模一样的
热备/冷备
热备,实时备份
冷备,隔一段时间备份
灾备(火灾),多个地域建立数据中心
采取冗余
数据安全,尽量分散
处理效率,越近越好
权衡
负载均衡
1)节点均衡
2)机架均衡
3)磁盘均衡
4、负载均衡
start-balancer.sh -threshold 5
当前这个操作的执行在什么时候结束
当集群中的任意两个节点的磁盘使用占比不超过5%的时候
sbin/start-balancer.sh -t 10%
机器容量最高的那个值和最低的那个值的差距不能超过10%