Hive报错org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask

在执行Hive大表与小表JOIN操作时遇到'org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask'错误,原因是默认开启的MapJoin导致内存不足。MapJoin是一种Hive优化策略,将小表加载到内存中进行map端JOIN。为解决此问题,可以禁用MapJoin并调整MapReduce任务数量。
摘要由CSDN通过智能技术生成

报错Error while compiling statement: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask

执行Hive两个表JOIN时出现如上错误

  1. 报错原因:

执行的join是大表和小表进性join,而Hive默认开启了MapJoin,即:hive.auto.convert.join=true;

但集群机器内存不够,导致出错。

  1. Map Join

map join本身是Hive优化的一种方式,即:如果关联的表中只有一张表是小表,那么可以在最大的表通过mapper的时候将小表放到内存中。这样,Hive就可以在map端执行join,每当扫描大表的时候,就去查看内存中的小表,找到可匹配的数据。如此,就减少了Reduce的过程,少了shuffle操作。

    • 0
      点赞
    • 1
      收藏
      觉得还不错? 一键收藏
    • 1
      评论
    评论 1
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包
    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值