Hadoop中的序列化
序列化:内存转化成字节码
中间通过字节码文件来实现传送数据
反序列化:字节码到内存
例如:输入格式为
id 7
手机号码 123466789
上行流量 9657
下行流量 3596
输出格式为
手机号码 123456789
上行流量 9657
下行流量 3596
总流量 9657+3596=13253
步骤:
- 实现Writable接口
定义三个属性 表示上行流量 下行流量和总流量
类型为long类型 - 编写序列化方法
在map中输出类型与reduce中输入类型一样
key为手机号 value为流量来进行处理