数据冗余:HDFS将文件划分为固定大小的块并将其复制到多台机器上。默认情况下,每个块会复制到集群中的三个不同的节点上
副本放置策略:HDFS通过副本放置策略将副本分散在不同的机架、不同的节点上,以减少因机架或节点级别故障而导致的数据丢失
心跳机制和故障检测:HDFS使用心跳机制来定期检测集群中的节点是否处于正常工作状态。如果某个节点长时间没有发送心跳信号,那么该节点可能发生了故障。HDFS会检测到这个故障,并尝试将该节点上的块复制到其它节点上,以确保数据的可用性。
自动故障恢复:当一个数据块的副本丢失或变得不可用时,HDFS会自动从其他可用的副本中选择一个进行复制,以确保每个数据块都有足够的副本数
客户端写入确认:HDFS的写入操作在客户端完成后并不立即返回成功,而是等待数据块的所有副本都成功写入后才返回成功