Hive和mapreduce相关的排序和运行的参数
1.设置每个reduce处理的数据量(单位是字节)
我们在hive中查看下
配置文件hive-site.xml.template
我们打开配置文件可以看到
这是256MB
如果超过1G,将使用4个reducers
2、设置最大运行的reduce的个数
同上我们可以在配置中找到下面的内容
复制到记事本里,简化了描述,从配置中我们可以看到默认reduce个数是1009
3.实际运行的reduce的个数
这个去哪里看呢?我们用之前执行过的reduce
访问8088端口,查看历史history