HDFS如何探测数据错误及进行数据恢复

HDFS数据错误分三种:名称节点错误、数据节点错误、数据块错误

1、数据节点错误

数据节点周期性发送心跳信息给名称节点,报告数据节点的状态信息。

当数据节点发生故障或者网络故障,名称节点无法收到数据节点的心跳信息,标记该数据节点为“宕机”,节点上的所有数据标记为不可读,名称节点不会像该数据节点发送如何I/O请求。

 该数据节点上的数据块的副本数量小于冗余因子。名称节点周期检查这种情况,一旦发现某个数据块的副本数量小于冗余因子,启动数据冗余复制,为它生成新的副本。

2、数据块错误

    文件被创建时,客户端会对每一个文件块进行信息摘录,并把这些信息写入同一个路径的隐藏文件里面。

    当客户端读取文件的时候,会先读取该信息文件,然后利用该信息我呢间对每个读取的数据块进行校验,如果校验出错,客户端就会请求另外一个数据节点读取该文件块,并向名称节点报告该文件块有错误,名称节点会定期检查并重新复制该数据块。

3、名称节点出错

    名称节点保存所有元数据信息,核心数据结构是FsImage和EditLog

    1、HDFS HA机制

  

  • 9
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值