Hadoop实现多输入路径输入

1.多路径输入

1)FileInputFormat.addInputPath 多次调用加载不同路径

String in0 = args[0];

String in1 = args[1];

String out = args[2];

FileInputFormat.addInputPath(job,new Path(in0));

FileInputFormat.addInputPath(job,new Path(in1));

FileOutputFormat.setOutputPath(job,new Path(out));

2)FileInputFormat.addInputPaths一次调用加载 多路径字符串用逗号隔开

FileInputFormat.addInputPaths(job, "hdfs://localhost:9000/cs/path1,hdfs://localhost:9000/cs/path2");

 

2.多种输入

MultipleInputs可以加载不同路径的输入文件,并且每个路径可用不同的maper

MultipleInputs.addInputPath(job, new Path("hdfs://localhost:9000/cs/path1"), TextInputFormat.class,MultiTypeFileInput1Mapper.class);

MultipleInputs.addInputPath(job, new Path("hdfs://localhost:9000/cs/path3"), TextInputFormat.class,MultiTypeFileInput3Mapper.class);

转载自:https://zhidao.baidu.com/question/2138952993402851188.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值