MapReduce任务报 org.apache.hadoop.hdfs.BlockMissingException: Could not obtain block:

博客讲述了在执行MapReduce任务时遇到`org.apache.hadoop.hdfs.BlockMissingException`异常的情况。首先尝试通过在shell脚本中删除损坏块解决问题,但任务依然失败。接着排查通信问题,并怀疑可能与此异常有关。第二天通过调整MapReduce任务的参数,如设置`mapreduce.input.fileinputformat.split.maxsize`为128MB并使用`CombineTextInputFormat`,显著减少了map任务数量,从而大幅缩短任务运行时间,但最终任务仍然失败。这表明问题可能隐藏在其他深层次的配置或系统状态中。
摘要由CSDN通过智能技术生成

1. 执行任务前,在shell脚本里已删除损坏的块

./hdfs fsck /.../ -delete

任务仍然失败了,报这个异常。

检查块还是健康的

./hdfs fsck /.../ -files

2. 通信问题可能导致这个异常

追根溯源

package org.apache.hadoop.hdfs;

package org.apache.hadoop.hdfs;

========================================================

第二天早上来看,任务又失败了

#合并小文件#,原来

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值