Hive 支持在 MR 任务结束之后,再另起一轮 MR 作业进行小文件的合并。这轮作业只会有 mapper, 没有 reducer. 每个 mapper 根据参数读入若干文件并输出成一个文件,从而达到文件合并的效果
与 mergefile 有关的参数有以下:
Hive 支持在 MR 任务结束之后,再另起一轮 MR 作业进行小文件的合并。这轮作业只会有 mapper, 没有 reducer. 每个 mapper 根据参数读入若干文件并输出成一个文件,从而达到文件合并的效果
与 mergefile 有关的参数有以下: