大数据技术之hadoop——（八）hadoop序列化

最新推荐文章于 2022-08-27 16:27:04 发布

「已注销」

最新推荐文章于 2022-08-27 16:27:04 发布

阅读量153

点赞数

分类专栏： hadoop 文章标签： hadoop mapreduce 大数据

本文链接：https://blog.csdn.net/m0_46615073/article/details/119721132

版权

文章目录

一、序列化概述
二、自定义类实现序列化接口
三、序列化案例实操
小结

一、序列化概述

1.1、什么是序列化？

序列化就是把内存中的对象，转换成字节序列（或其他数据传输协议）以便于存储到磁盘（持久化）和网络传输。
反序列化就是将收到字节序列（或其他数据传输协议）或者是磁盘的持久化数据，转换成内存中的对象。

1.2、为什么要序列化？

一般来说，“活的”对象只生存在内存里，关机断电就没有了。而且“活的”对象只能由本地的进程使用，不能被发送到网络上的另外一台计算机。然而序列化可以存储“活的”对象，可以将“活的”对象发送到远程计算机。

1.3、为什么不用java的序列化？

Java 的序列化是一个重量级序列化框架（Serializable），一个对象被序列化后，会附带很多额外的信息（各种校验信息，Header，继承体系等），不便于在网络中高效传输。所以，Hadoop 自己开发了一套序列化机制（Writable）

这里参照大佬文章演示参考文章

对比java序列化和hadoop序列化

【1】java序列化

package com.zhou.MapReduce.Serialization.java;
import java.io.Serializable;

/**
 * @author zhouhao
 * @date 2021/8/15 - 22:19
 */
public class Student implements Serializable {
   
    private String name;
    private int age;

    public Student(String name, int age) {
   
        this.name = name;
        this.age = age;
    }
    public String getName() {
   
        return name;
    }
    public void setName(String name) {
   
        this.name = name;
    }
    public int getAge() {
   
        return age;
    }
    public void setAge(int age) {
   
        this.age = age;
    }
}

package com.zhou.MapReduce.Serialization.java;

import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.ObjectOutputStream;

/**
 * @author zhouhao
 * @date 2021/8/15 - 22:21
 */
public class Application {
   

    public static void main(String[] args) {
   
        try {
   
            ByteArrayOutputStream baos = new ByteArrayOutputStream();

            ObjectOutputStream oos = new ObjectOutputStream(baos);
            oos.writeObject(new Student("zhangsan", 20));
            System.out.println("字节大小：" + baos.size());
            oos.close();
            baos.close();

        } catch (IOException e) {
   
            e.printStackTrace();
        }
    }
}

执行结果：
在这里插入图片描述

【2】hadoop序列化

package com.zhou.MapReduce.Serialization.hadoop;
import org.apache.hadoop.io.Writable;
import org.apache.hadoop.io.WritableComparable;
import java

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
大数据技术之hadoop——（八）hadoop序列化

什么是序列化：序列化就是将内存中的对象转换为字节传输，反序列化就是将接收到的字节序列转换为对象为什么要序列化：方便传输和持久化为什么不用java的序列化：java序列化泰国笨重效率不高自定义类实现序列化接口必须有空参构造序列化和反序列化顺序必须一致，如果要作为key传输则要实现Comparable接口
复制链接

扫一扫