HDFS容错性设计有哪些?

写在前面

本文隶属于专栏《1000个问题搞定大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和文献引用请见1000个问题搞定大数据技术体系

解答

在这里插入图片描述

容错性设计HDFS内置了良好的容错性设计策略,以降低各种故障情况下数据丢失的可能性,接下来针对几个常见的分布式故障场景,分析HDFS对应的容错策略。

  1. NameNode故障

    NameNode内存中记录了文件系统的元信息,这些元信息一旦丢失,将导致整个文件系统数据不可用。

    HDFS允许为每个 Active NameNode 分配个 StandbyNameNode,以防止单个 NameNode 宕机后导致元信息丢失和整个集群不可访问。

  2. DataNode故障

    每个 DataNode 保存了实际的数据块,这些数据块在其他 DataNode 上存在相同的副本。

    DataNode 能通过心跳机制向 NameNode 汇报状态信息,当某个DataNode 宕机后, NameNode 可在其他节点上重构该 DataNode 上的数据块,以保证每个文件的副本数在正常水平线上。

  3. 数据块损坏

    DataNode 保存数据块时,会同时生成一个校验码。

    当存取数据块时, 如果发现校验码不一致,则认为该数据块已经损坏, NameNode 会通过其他节点上的正常副本重构受损的数据块。

  • 14
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 25
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 25
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值