1设置合理的 map 和 reduce 的个数 2 设置合理的 blocksize 3避免出现数据倾斜 4使用 combine 函数 5对数据进行压缩 6优化 MM 参数() 7将 HDFS 上的小文件合并成 SequenceFile 大文件后再进行文件处理操作