MR程序数据倾斜现象

数据倾斜出现现象

整个job执行很久,或者无法执行成功,无法执行完毕

数据倾斜出现原因

原因 shuffle -->分区逻辑 key本身就是倾斜的 内存不足
分区逻辑(可能取模之后就直接分配不均衡)
key倾斜(有一个key的数量多取模之后它的分区数据也多)

数据倾斜解决方法

  1. 重写分区逻辑
  2. 重新设计key √
  3. 增加reduce的并行度 2----->10
  4. 避免shuffle(reduce没有或为1)
  5. 增加一些内存
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值