CannotObtainBlockLengthException问题分析

用户反馈MR任务失败,通过查看job的diagnose信息,发现如下异常

另外需要交待一下背景,下午发生2个datanode机器同时宕机的问题,我们是有2副本的数据的,因此当2个datanode同时失效,一定会有一定比例的块丢失,在这两个datanode恢复一个之前,一定又有hdfs的客户端报错Missing Block。

本文这个问题更加特殊,在这个任务失败前,2个宕机节点都已经恢复了,不存在missing block。

所以这个情况给了我们一个非常重要的警示,即使不存在missing block,不代表hdfs的数据状态就100%正常的,而且hdfs不会给出提示,目前只有客户端读取这些数据的时候才能发现,不可不谓一个重大的隐患。

 

在datanode恢复以后,没有missing block依然有状态不正常的数据,我们可以很自然的想到,数据没有丢,但是正在write过程中的数据,由于datanode强行的关闭,导致namenode对block的状态了解的不正常。

涉及到write的过程,我们很自然的可以了解到写锁,在hdfs里叫租约机制。 这个时候我们的一个猜想就是这个block是存在的,但是因为datan

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值