Hadoop 源代码分析（三）对象序列化

最新推荐文章于 2024-08-28 16:50:16 发布

我爱大海V5

最新推荐文章于 2024-08-28 16:50:16 发布

阅读量746

点赞数

分类专栏： Hadoop 文章标签： hbase 源代码

Hadoop 专栏收录该内容

39 篇文章 0 订阅

订阅专栏

由于Hadoop 的MapReduce 和HDFS 都有通信的需求，需要对通信的对象进行序列化。Hadoop 并没有采用Java 的序列化，而是

引入了它自己的系统。

org.apache.hadoop.io 中定义了大量的可序列化对象，他们都实现了Writable 接口。实现了Writable 接口的一个典型例子如

下：

Java 代码

1. public class MyWritable implements Writable {

2. // Some data

3. private int counter;

4. private long timestamp;

5.

6. public void write(DataOutput out) throws IOException {

7. out.writeInt(counter);

8. out.writeLong(timestamp);

9. }

10.

11. public void readFields(DataInput in) throws IOException {

12. counter = in.readInt();

13. timestamp = in.readLong();

14. }

15.

16. public static MyWritable read(DataInput in) throws IOException {

17. MyWritable w = new MyWritable();

18. w.readFields(in);

19. return w;

20. }

21.}

其中的write 和readFields 分别实现了把对象序列化和反序列化的功能，是Writable 接口定义的两个方法。下图给出了庞大的

org.apache.hadoop.io 中对象的关系。

Hadoop 源代码分析（三）对象序列化 - manny - 你的目标-卓越非凡

这里，我把ObjectWritable 标为红色，是因为相对于其他对象，它有不同的地位。当我们讨论Hadoop 的RPC 时，我们会提到RPC

上交换的信息，必须是Java 的基本类型，String 和Writable 接口的实现类，以及元素为以上类型的数组。ObjectWritable 对

象保存了一个可以在RPC 上传输的对象和对象的类型信息。这样，我们就有了一个万能的，可以用于客户端/服务器间传输的

Writable 对象。例如，我们要把上面例子中的对象作为RPC 请求，需要根据MyWritable 创建一个ObjectWritable，

ObjectWritable 往流里会写如下信息

对象类名长度，对象类名，对象自己的串行化结果

这样，到了对端，ObjectWritable 可以根据对象类名创建对应的对象，并解串行。应该注意到，ObjectWritable 依赖于WritableFactories，那存

储了Writable 子类对应的工厂。我们需要把MyWritable 的工厂，保存在WritableFactories 中（通过WritableFactories.setFactory）。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。