自定义类
当我们需要发送的数据超过一个变量的时候
1)需要实现一个接口:Writable
2)需要实现两个抽象方法:
write() 序列化
ReadFields() 反序列化
注意:自定义类不能放在map输出的key的位置,其他位置都可以。
案例:
package com.lee.define;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
/*
* map端:
* key:手机号
* value:上行流量+下行流量
* 拼串 自定义类
* reduce端:
* 累加求和
* */
public class Flow {
static class myMapper ext