第一点 正确地配置你的Cluster(块大小、
分片大小、map端参数、reduce端参数)
第二点 使用LZO压缩
第三点 调整map和reducetask的数量到合适的值
第四点 为job添加一个Combiner
第五点 为你的数据使用最合适和简洁的Writable类型
第六点 重用Writable类型
第七点 使用简易的剖析方式查看task的运行
第一点 正确地配置你的Cluster(块大小、
分片大小、map端参数、reduce端参数)
第二点 使用LZO压缩
第三点 调整map和reducetask的数量到合适的值
第四点 为job添加一个Combiner
第五点 为你的数据使用最合适和简洁的Writable类型
第六点 重用Writable类型
第七点 使用简易的剖析方式查看task的运行