内存和磁盘之间是频繁的进行数据的交换的。
序列化:
把内存中的对象以字节数组的形式写入磁盘中的过程,就叫做序列化
反序列化:
把磁盘中的字节数组转换成对象的形式写入内存的过程。
java中的序列化:
Java中的序列化是比较重量级的序列化,不适用于海量数据的处理。
hadoop中的序列化
在java序列化基础上按照海量数据处理的方式进行了改进,改成轻量级的序列化,适合海量数据处理,原理上和java中序列化一样,方式不同
数据类型:
java基本数据类型 序列化类型
byte ByteWritable
short ShortWritable
int(char) IntWritable
long LongWritable
double DoubleWritable
float FloatWritable
boolean BooleanWritable
String Text
Array ArrayWritable
null NullWritable
自定义序列化