hadoop的序列化
在数据传输的过程中,存储在内存中传输的数据,解决数据在传输过程中因网络传输故障出现的断裂现象。
把内存当中正在运行的数据对象,转换成字节序列以便于存储和网络传输
反序列化:将收到的字节序列或者硬盘的持久化数据,转换成内存中的对象。
java的序列化:Serializable
java的序列化是一个重量级序列化,会附带很多额外的信息,(效验信息,头信息,继承体系等),不便于数据在网络中的传输。
hadoop的序列化:Writable 精简/高效。
重要的原因:hadoop通信是通过远程调用的rpc实现的,需要进行序列化
特点:紧凑/快速/可拓展/互操作支持多语言
//java数据类型
int /float/double/byte/String/boolean/map/array
//hadoop数据类型
IntWritable/FloatWritable/DoubleWritablr/ByteWritable/Text/BooleanWritable/MapWritable/ArrayWritable