Hadoop多路径输出(MultipleOutputs)

最新推荐文章于 2017-11-02 13:07:00 发布

lgdlxc

最新推荐文章于 2017-11-02 13:07:00 发布

阅读量1k

点赞数

分类专栏： Hadoop 文章标签： hadoop 多路径输出 MultipleOutputs

本文链接：https://blog.csdn.net/lgdlxc/article/details/49869377

版权

Hadoop 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

使用Hadoop进行数据处理时，有时候需要将计算结果根据不同的条件存入不同的分区。

比如：计算顾客是否回头购买的时候，会将回头了的顾客数据和未回头的顾客数据分别存入不同的表。

可以使用MultipleOutputs实现。

需要在reduce类中定义MultipleOutputs,并且重写Reducer的setup()方法和cleanup()方法。具体实例如下

public static class PeriodReduce extends Reducer<TextPair,Text,NullWritable,Text>{
		private MultipleOutputs<NullWritable, Text> mos;
		
		protected void setup(Context context)throws IOException,InterruptedException{
			mos = new MultipleOutputs<NullWritable, Text>(context);
		}
		
		protected void cleanup(Context context)throws IOException,InterruptedException{
			mos.close();
		}
		
		public void reduce(TextPair key,Iterable<Text> values,Context context)throws IOException,InterruptedException{
			
			Iterator<Text> it = values.iterator();
			ArrayList<String> custInfo = null;
			String last ="notexist";
			String ret = "notexist";
			while (it.hasNext()){
				String line = it.next().toString();
				//排序后，先到达reduce的数据是上个周期的
				if(key.getId()==0){
					custInfo = new ArrayList<String>();
					//将上个周期的购买情况存放
					custInfo.add(line);
					last = "exist";
				}else if(key.getId()==1){
					ret = "exist";
					//如果回头，则加上上个周期信息放入return目录下
					if("exist".equals(last)&&custInfo.size()>0){
						for(String str:custInfo){
							mos.write(NullWritable.get(), new Text(line+"\001"+str),"return/r");
						}
					}
				}
				
				//如果没有回头，直接输出上期
				if("exist".equals(last)&&"notexist".equals(ret)){
					for(String str:custInfo){
						mos.write(NullWritable.get(), new Text(key.getText()+"\001"+str),"loss/l");
					}
					
				}
			}
		}

	}

lgdlxc

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hadoop多路径输出(MultipleOutputs)

使用Hadoop进行数据处理时，有时候需要将计算结果根据不同的条件存入不同的分区。比如：计算顾客是否回头购买的时候，会将回头了的顾客数据和未回头的顾客数据分别存入不同的表。可以使用MultipleOutputs实现。需要在reduce类中定义MultipleOutputs,并且重写Reducer的setup()方法和cleanup()方法。具体实例如下public static c
复制链接

扫一扫