前言
在上一篇文章《Hive 作业产生的map数越多越好还是越少越好?》中介绍了map个数设置多少合适的问题,那么Reduce个数设置多少合适呢?今天就给小伙伴们聊一下Reduce个数设置方法以及设置多少合适的原则!
1. Reduce个数设置方法
方法1
首先我们来看下reduce数的计算公式:
N=min(参数2,总输入数据量/参数1)
上述参数说明:
参数1:每个reduce任务处理的数据量大小,默认值为256M。
可以通过如下参数进行设置:
set hive.
在上一篇文章《Hive 作业产生的map数越多越好还是越少越好?》中介绍了map个数设置多少合适的问题,那么Reduce个数设置多少合适呢?今天就给小伙伴们聊一下Reduce个数设置方法以及设置多少合适的原则!
首先我们来看下reduce数的计算公式:
N=min(参数2,总输入数据量/参数1)
上述参数说明:
参数1:每个reduce任务处理的数据量大小,默认值为256M。
可以通过如下参数进行设置:
set hive.