hadoop的数据序列化类型
IntWritable,FloatWritable,LongWritable,DoubleWritable,Text,
BooleanWritable,ByteWritable,MapWritable,ArrayWritable
JAVA的数据类型
int,float,long,double,string,boolean,byte,map,array
为什么要序列化?
序列化就是把内存当中的对象,转换成字节序列比便于存储和网络传输
存储“活的对象”
hadoop序列化实现了hadoop的上传和下载
java序列化实现了网络传输
反序列化就是将收到的字节序列或者硬盘的持久化数据,转换成内存中的对象。
java的序列化->Serializable
为什么不用java提供的序列化接口?
java的序列化是一个重量级的序列化框架,一个对象被序列化后会附带很多额外的信息(校验信息,header,继承体系等)。
不便于在网络中的高效传输,所以hadoop开发了一套序列化机制(Writable),精简/高效。
为什么序列化在hadoop中很重要?
hadoop通信是通过远程调用(rpc)实现的,需要进行序列化
特点:
1)紧凑
2)快速
3)可拓展
4)互操作