hive在执行一个HQL产生的MR JOB的时候默认是以以下方式决定reducer的个数的,
N=min(参数2,总输入数据量/参数1) 第一个参数 默认为1000^3 : hive.exec.reducers.bytes.per.reducer 第二个参数 默认为999 :hive.exec.reducers.max(默认为999) 可以手动设置这个值set mapred.reduce.tasks=1000
hive在执行一个HQL产生的MR JOB的时候默认是以以下方式决定reducer的个数的,
N=min(参数2,总输入数据量/参数1) 第一个参数 默认为1000^3 : hive.exec.reducers.bytes.per.reducer 第二个参数 默认为999 :hive.exec.reducers.max(默认为999) 可以手动设置这个值set mapred.reduce.tasks=1000