Java序列化的三种方式
最近在看《码出高效 Java开发手册》,里面有一篇对于序列化的讲解,其是这么说的:内存中的数据对象只有转换为二进制流的形式才能进行数据持久化和网络传输。将数据对象转化成二进制流的过程称为对象的序列化。反之,将二进制流恢复为数据对象的过程称为反序列化。序列化需要保留充分的信息以恢复数据对象,但是为了节约存储对象空间和网络带宽,序列化后的二进制流又要尽可能小。序列化常见的使用场景是RPC框架的数据传输。
常见的序列化方式有三种:
Java原生序列化
Java原生序列化我们可能会了解的比较多,Java类通过实现Serializable接口来实现该类对象的序列化,这个接口非常特殊,没有任何方法,只起标识作用。Java序列化保留了对象类的元数据(如类、成员变量、继承类信息),以及对象数据等,兼容性最好,但不支持跨语言,而且性能一般。
下面我们来写一个简单的例子
public class User implements Serializable {
private String username;
private String sex;
private Integer age;
public User(){}
public User(String username, String sex, Integer age) {
this.username = username;
this.sex = sex;
this.age = age;
}
......get、set、toString方法略
}
public class UserTest {
public static void main(String[] args) throws IOException, ClassNotFoundException {
File file = new File("D:/user.out");
//java序列化
try (OutputStream out = new FileOutputStream(file);
ObjectOutputStream outputStream = new ObjectOutputStream(out)) {
User user = new User("Tom", "man", 20);
outputStream.writeObject(user);
}
//反序列化
try (InputStream input = new FileInputStream(file);
ObjectInputStream inputStream = new ObjectInputStream(input)) {
User user1 = (User) inputStream.readObject();
System.out.println(user1);
}
}
}
运行结果:
User{username='Tom', sex='man', age=20}
这时,我们看到结果是正确的。
但是,当我们User类又增加了身高height属性的时候,再进行反序列化的时候会不会报错呢?
运行结果如下:
Exception in thread "main" java.io.InvalidClassException: com.qiao.springboot.serializable.User; local class incompatible:
stream classdesc serialVersionUID = 6267131309091846068,
local class serialVersionUID = -3011312244378199836
at java.io.ObjectStreamClass.initNonProxy(ObjectStreamClass.java:616)
at java.io.ObjectInputStream.readNonProxyDesc(ObjectInputStream.java:1843)
at java.io.ObjectInputStream.readClassDesc(ObjectInputStream.java:1713)
at java.io.ObjectInputStream.readOrdinaryObject(ObjectInputStream.java:2000)
at java.io.ObjectInputStream.readObject0(ObjectInputStream.java:1535)
at java.io.ObjectInputStream.readObject(ObjectInputStream.java:422)
at com.qiao.springboot.serializable.UserTest.main(UserTest.java:17)
这里我们可以看到,两个serialVersionUID值不相同,反序列化失败。
实现Serializable接口的类建议设置serialVersionUID字段值,如果不设置,那么每次运行时,编译器都会根据类的内部实现,包括类名,接口名,方法和属性等来自动生成serialVersionUID。如果类的源代码有修改,那么重新编译后的serialVersionUID的取值可能会发生改变,因此,实现Serializable接口的类一定要显示的定义serialVersionUID属性值。修改类时需要根据兼容性决定是否修改serialVersionUID值:
- 如果是兼容升级,请不要修改serialVersionUID字段,避免反序列化失败。
- 如果是不兼容升级,需要修改serialVersionUID值,避免反序列化混乱。
使用Java原生序列化需要注意,Java反序列化时不会调用类的无参构造方法,而时调用native方法将成员变量赋值为对应类型的初始值。基于性能及兼容性考虑,不建议使用Java原生序列化。
Hessian序列化
Hessian序列化是一种支持动态类型、跨语言、基于对象传输的网络协议。Java对象序列化的二进制流可以被其他语言(如c++、python)反序列化。Hessian协议具有如下特性:
- 自描述序列化类型。不依赖外部描述文件或接口定义,用一个字节标识常用基本类型,极大缩短二进制流。
- 语言无关,支持脚本语言。
- 协议简单,比Java原生序列化高效。
Hessian会把复杂对象所有的属性存储在一个Map中进行序列化,所以在父类、子类存在同名成员变量的情况下,Hessian序列化时,先序列化子类,然后序列化父类,因此反序列化结果会导致子类同名成员变量被父类的值覆盖。
下面是一个简单的例子:
public class Person {
private String name;
}
public class Student extends Person implements Serializable {
private String name;
private String stu_id;
......set、get、toString方法略
}
public static void main(String[] args) throws IOException {
Student student = new Student();
student.setName("Amy");
student.setStu_id("1001");
ByteArrayOutputStream os = new ByteArrayOutputStream();
Hessian2Output output = new Hessian2Output(os);
output.writeObject(student);
output.close();
ByteArrayInputStream inputStream = new ByteArrayInputStream(os.toByteArray());
Hessian2Input input = new Hessian2Input(inputStream);
Student stu = (Student) input.readObject();
System.out.println(stu);
}
结果:
Student{name='null', stu_id='1001'}
相同名字的属性 在反序列化的是时候,由于子类在父类前面,子类的属性总是会被父类的覆盖,由于java多态属性,在上述例子中父类 student.name = null。
所以一定要注意的一点是:
使用Hessian序列化时,一定要注意子类和父类不能有同名字段
相比Hessian 1.0 , Hessian 2.0中增加了压缩编码,其序列化二进制流大小是Java序列化的50%,序列化耗时是Java序列化的30%,反序列化耗时是Java反序列化的20%。
Json序列化
Json是一种轻量级的数据交换格式,Json序列化就是将数据对象转换成Json字符串,在序列化过程中抛弃了类型信息,所以反序列化时只有提供类型信息才能准确的反序列化。相比前两种方式,JSON可读性比较好,方便调试。
下面看一个例子:
public static void main(String[] args) throws IOException {
Student student = new Student();
student.setName("Amy");
student.setStu_id("1001");
//序列化
String jsonStr = JSON.toJSONString(student);
//反序列化
Student stu = JSON.parseObject(jsonStr, Student.class);
System.out.println(stu);
}
结果:
Student{name='Amy', stu_id='1001'}
如果不想某个敏感字段参与序列化,那么可以加transient关键字,避免把此属性信息转化为序列化的二进制流。
本文参考与《码出高效 Java开发手册》