MR编程注意事项

在公司集群上跑MapReduce的时候会遇到一些异常报错,主要还是我们编程时没注意极端情况,想当然的认为没有bug就能顺利运行。

Reduce卡在某个进度

while (iterator.hasNext()) {
	System.out.prinltn("Hello World");
    // String[] arr = iterator.next().toString().split("\t");
}

这是因为没有进行 iterator.next() 操作,导致程序陷入死循环。如果其中还有写数据的逻辑,那么可能导致磁盘空间紧张。

Inner error, IOException

如果单独拉一个part下来能测试通过,但在集群上老是报上述错误,那么有两种情况:

  • 相同key下的value内的元素过多,有千万个
  • 不同的key太多,有千万个

上述两种情况不一定会触发异常报错,但如果出现了,请从这两个方面排查。

程序没报异常,但是failed with code 137

这是因为reduce阶段iterator内的元素个数太多,导致内存溢出,解决方法是设置更大的内存或者设置多个key来均匀分布value

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值