Hadoop MapReduce 多路径输入与多个输入

本文详细介绍了Hadoop MapReduce中如何处理多路径输入和多个输入,包括FileInputFormat的静态方法,如addInputPath、addInputPaths和setInputPaths。此外,还讲解了MultipleInputs类如何实现不同输入路径使用不同Mapper处理,以及如何配置实现递归处理输入目录。
摘要由CSDN通过智能技术生成

1. 多路径输入

FileInputFormat 是所有使用文件作为其数据源的 InputFormat 实现的基类,其中一个重要功能就是指定作业的输入文件位置。因为作业的输入被设定为一组路径,这对限定作业输入提供了很强的灵活性。FileInputFormat 类提供了四种静态方法来指定作业的输入路径:

public static void addInputPath(Job job, Path path);
public static void addInputPaths(Job job, String commaSeparatedPaths);
public static void setInputPaths(Job job, Path... inputPaths);
public static void setInputPaths(Job job, String commaSeparatedPaths);

这四种静态方法可以分为两大类:

  • addXXX:其中包含 addInputPath 和 addInputPaths 方法,这两个方法可以将一个或者多个路径加入到路径列表中

  • setXXX:其中包含 setInputPaths 和 setInputPaths 方法,这两个方法一次性将一个或者多个路径设定为完整的路径列表

1.1 addInputPath

使用 FileInputFormat.addInputPath 方法,一次只能指定一个路

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

@SmartSi

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值