HADOOP序列化学习笔记

最新推荐文章于 2023-03-24 10:39:05 发布

Jaden_JH

最新推荐文章于 2023-03-24 10:39:05 发布

阅读量111

点赞数

文章标签： hadoop 学习 mapreduce

本文链接：https://blog.csdn.net/weixin_48626604/article/details/123384576

版权

一般来说，“活的”对象只生存在内存中，关机断点就没有了。而且“活的”对象只能由本地的进程使用，不能被发送到网络上的另外一台计算机上，然而序列化可以储存“活的”对象，可以将“活的”对象发送到远程计算机上。

Java的序列化是一个重量级序列化框架（Serializable），一个对象被序列化后，会附带很多额外的信息（各种校验信息，Header，继承体系等），不便于在网络中高效传输。所以，Hadoop自己开发一套序列化机制（Writable）。

在开发中往往常用的基本序列化类型不能满足所有需求，比如在Hadoop框架内部传递一个bean对象，那么该对象就需要实现序列化接口

具体实现bean对象序列化步骤如下7步

重写序列化方法

@Override
public void write(DataOutput out) throws IOException {
	out.writeLong(upFlow);
	out.writeLong(downFlow);
	out.writeLong(sumFlow);
}

重写反序列化方法

@Override
public void readFields(DataInput in) throws IOException {
	upFlow = in.readLong();
	downFlow = in.readLong();
	sumFlow = in.readLong();
}