大数据 Hadoop序列化

最新推荐文章于 2024-09-19 15:53:35 发布

置顶豌豆猫喵喵喵

最新推荐文章于 2024-09-19 15:53:35 发布

阅读量154

点赞数

分类专栏：大数据技术文章标签： hadoop 大数据 java

本文链接：https://blog.csdn.net/qq_15724113/article/details/105085125

版权

7 篇文章 0 订阅

订阅专栏

序列化概述

对象只存在于内存中，关机断电就没有了，而且激活的对象只能由本地的进程使用，不能被发送到网络上的另一台计算机上。序列化是程序数据存储的一种形式。储存的数据可以被再次提取以及发送到另一台设备上。

Java的序列化是一个重量级的序列化框架 (Serializable),一个对象被序列化后，会附带很多额外的信息(各种校验信息，Header，继承体系等)，不便于在网络中高效的传输。所以，Hadoop自己开发了一套序列化机制(Writable)。

Java中的常用类型，在Hadoop中都有对应的序列化实现类。其对应关系如下图所示：
在这里插入图片描述

在企业开发中往往常用的基本序列化类型不能满足所有需求，比如在Hadoop框架内部传递一个bean对象，那么该对象就需要实现序列化接口。
具体实现bean对象序列化步骤如下7步。

public Bean() {
	super();
}

@Override
public void write(DataOutput out) throws IOException {
	out.writeLong(attr1);
	out.writeLong(attr2);
	out.writeLong(attr3);
}

@Override
public void readFields(DataInput in) throws IOException {
	attr1 = in.readLong();
	attr2 = in.readLong();
	attr3 = in.readLong();
}

关注

专栏目录