【Hadoop】序列化

最新推荐文章于 2023-12-22 16:26:08 发布

Nicht_Sehen

最新推荐文章于 2023-12-22 16:26:08 发布

阅读量146

点赞数

分类专栏： Hadoop

本文链接：https://blog.csdn.net/Nicht_sehen/article/details/104768278

版权

Hadoop 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

序列化指把内存中的对象，转换成字节序列（或其他数据传输协议）以便于存储到磁盘（持久化）和网络传输

Hadoop序列化特点：

1）紧凑：高效使用存储空间
2）快速：读写数据的额外开销小
3）可扩展：随着通信协议的升级而升级
4）互操作：支持多语言的交互

自定义实现序列化接口：

（1）必须实现Writable接口
（2）反序列化时，需要反射调用空参构造函数，所以必须有空参构造

public FlowBean() {
	super();
}

（3）重写序列化方法

@Override
public void write(DataOutput out) throws IOException {
	out.writeLong(upFlow);
	out.writeLong(downFlow);
	out.writeLong(sumFlow);
}

（4）重写反序列化方法

@Override
public void readFields(DataInput in) throws IOException {
	upFlow = in.readLong();
	downFlow = in.readLong();
	sumFlow = in.readLong();
}

（5）注意反序列化的顺序和序列化的顺序完全一致
（6）要想把结果显示在文件中，需要重写toString()，可用”\t”分开，方便后续用。
（7）如果需要将自定义的bean放在key中传输，则还需要实现Comparable接口，因为MapReduce框中的Shuffle过程要求对key必须能排序。详见后面排序案例。

@Override
public int compareTo(FlowBean o) {
	// 倒序排列，从大到小
	return this.sumFlow > o.getSumFlow() ? -1 : 1;
}

Nicht_Sehen

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【Hadoop】序列化

序列化指把内存中的对象，转换成字节序列（或其他数据传输协议）以便于存储到磁盘（持久化）和网络传输Hadoop序列化特点：1）紧凑：高效使用存储空间2）快速：读写数据的额外开销小3）可扩展：随着通信协议的升级而升级4）互操作：支持多语言的交互自定义实现序列化接口：（1）必须实现Writable接口（2）反序列化时，需要反射调用空参构造函数，所以必须有空参构造public FlowB...
复制链接

扫一扫