保证元数据安全
采用SecondaryNameNode备份或者HA备份。
保证数据块安全
1)多副本机制
存储在HDFS系统上的文件,会分割成128M大小的block存储在不同的节点上,block的副本数默认3 份,也可配置成更多份;
2)机架感知原理
对于常见情况,当副本数为3时,HDFS的放置策略是,如果写入程序(client)位于datanode上,则将一个副本放置在本地计算机上,否则随机放置在一个datanode上,另一个副本放置在不同(远程)机架中的节点上,最后一个副本放置在同一远程机架中的不同节点上。
此策略减少机架间写入、读取时的网络通信。
此策略不会影响数据可靠性和可用性保证。
一个块只放在两个而不是三个单独的机架中;
机架故障的概率远小于节点故障的概率。
3)datanode会周期性的报告block信息
datanode会默认每小时把自己节点上的所有块状态信息报告给namenode。
4)采用safemode模式
datanode上报块信息后,Namenode会计算block的损坏率,当阀值 <0.999f 时系统会进入安全模式,HDFS只读不写。
文章介绍了HDFS保证数据安全的措施,包括SecondaryNameNode或HA备份元数据,使用多副本机制(默认3副本)确保数据块安全,利用机架感知策略优化存储和减少网络通信,datanode定期向namenode报告block状态,以及通过safemode监控block损坏率来保护系统。
2203

被折叠的 条评论
为什么被折叠?



