hadoop文件的序列化
- Hadoop中序列化机制在每个类对象第一次出现时候保持了每个类的信息,如类名,第二次出现时候会有一个类的reference,导致空间浪费。
- Java序列化不能复用对象,Java反序列化时候每次需要构造出新对象。在Hadoop序列化机制中,反序列化的对象是可以复用的。
Hadoop中定义了两个序列化相关的接口:Writable和Comparable,这2个接口可以合成一个WritableComparable接口
Writable接口
- 将状态写入二进制格式的DataOutput流
- 另一个用于从二进制格式的DataInput流读取其状态
- 1
- 2
- 3
- 4
IntWritable
宁波整形美容医院http://www.zuanno.com/
- 1
- 2
- 3
- 4
- 5
- 6