A 默认序列化框架是 Writable接口, 缺点: 缺乏语言的可移植性
B 不使用java Serialization, 缺点: 不够精简, 用起来非常纠结, 无法做到 精简,快速, 可扩展, 支持互操作
C Apache Thrift 一般用来作为二进制 数据的永久存储格式, Mapreduce格式对该类的支持有限
D Google Protocol框架 一般用来做二进制数据的永久存储格式,Mapreduce格式对该类的支持有限
E: Avro 更加有生命力, 与编程语言无关, 非常使用hadoop的大规模数据处理。
Avro模式议案使用JSON来写, 数据通常采用二进制格式来编码
和其他序列化类库想比, Avro的性能更好。
=======================================================================================
hadoop权威指南 第三版 page 127