Hadoop序列化与Java实现

最新推荐文章于 2024-07-21 19:55:43 发布

才是一个小码农

最新推荐文章于 2024-07-21 19:55:43 发布

阅读量167

点赞数

文章标签： hadoop java 大数据

本文链接：https://blog.csdn.net/qq_27896233/article/details/131418865

版权

序列化是一种将对象转换为字节流的过程，这样就可以将对象持久化到硬盘或通过网络发送到其他任何地方。反序列化则是将字节流转换回对象的过程。在Hadoop中，序列化和反序列化是非常重要的，因为它们用于在网络和磁盘之间传输数据。

Hadoop提供了自己的序列化框架，即Writable接口。所有Hadoop的数据类型都实现了这个接口。这个接口定义了序列化和反序列化的方法，如write()和readFields()。

下面是一个简单的Java实现Hadoop序列化的例子：



import java.io.*;
import org.apache.hadoop.io.*;

public class IntWritableTest {
    public static void main(String[] args) throws Exception {
        IntWritable writable = new IntWritable(163);
        byte[] bytes = serialize(writable);
        System.out.println(bytes.length);
        System.out.println(deserialize(bytes));
    }

    public static byte[] serialize(Writable writable) throws IOException {
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        DataOutputStream dataOut = new DataOutputStream(out);
        writable.write(dataOut);
        dataOut.close();
        return out.toByteArray();
    }

    public static Writable deserialize(byte[] bytes) throws IOException {
        ByteArrayInputStream in = new ByteArrayInputStream(bytes);
        DataInputStream dataIn = new DataInputStream(in);
        IntWritable writable = new IntWritable();
        writable.readFields(dataIn);
        dataIn.close();
        return writable;
    }
}