诡异问题
生产环境 mr 运行任务 map端和reduce 的运行内存都设置的为0 (此为cloudra 的默认配置)
为作业的每个 Map 任务分配的物理内存量(MiB)。对于早于 CDH 5.5 的版本,如果未指定内存量,则默认设置为 1024。对于 CDH 5.5 及更高版本,不支持小于 128 的值,但如果将其指定为 0,则可以通过 Map 任务的最大堆大小以及堆与容器的大小比值推断要请求的物理内存量。如果未指定 Map 任务的最大堆大小,则要请求的物理内存量默认设置为 1024。
根据提示 他会参考 最大堆的 参数(也为0) 所有更加配置得出 其map 端和reduce 端 都取默认值 1G
但是同样的配置 在测试环境报错 143 (既运行内存不够的情况)
修改配置如下 数据成功跑出
问题推测原因: 可能是线上运行的主要是解析日志需求 1G 已经足够,但是测试环境因运行TPCx-BB 基准测试时所需的mr 程序需要更大的运行内存 所以改成10G
问题注意此配置