概念
序列化 把对象转换为字节序列的过程称为对象的序列化;
反序列化 字节序列恢复为对象的过程称为对象的反序列化。
序列化的作用
- 把对象的字节序列永久地保存到硬盘上,通常存放在一个文件中;
在很多应用中,需要对某些对象进行序列化,让它们离开内存空间,入住物理硬盘,以便长期保存。比如最常见的是Web服务器中的Session对象,当有 10万用户并发访问,就有可能出现10万个Session对象,内存可能吃不消,于是Web容器就会把一些seesion先序列化到硬盘中,等要用了,再把保存在硬盘中的对象还原到内存中。
- 在网络上传送对象的字节序列。
当两个进程在进行远程通信时,彼此可以发送各种类型的数据。无论是何种类型的数据,都会以二进制序列的形式在网络上传送。发送方需要把这个Java对象转换为字节序列,才能在网络上传送;接收方则需要把字节序列再恢复为Java对象。
JDK类库中的序列化API
ObjectOutputStream代表对象输出流,它的writeObject(Object obj)方法可对参数指定的obj对象进行序列化,把得到的字节序列写到一个目标输出流中。
ObjectInputStream代表对象输入流,它的readObject()方法从一个源输入流中读取字节序列,再把它们反序列化为一个对象,并将其返回。
只有实现了Serializable和Externalizable接口的类的对象才能被序列化。Externalizable接口继承自 Serializable接口,实现Externalizable接口的类完全由自身来控制序列化的行为,而仅实现Serializable接口的类可以 采用默认的序列化方式 。
对象序列化包括如下步骤:
1) 创建一个对象输出流,它可以包装一个其他类型的目标输出流,如文件输出流;
2) 通过对象输出流的writeObject()方法写对象。
对象反序列化的步骤如下:
1) 创建一个对象输入流,它可以包装一个其他类型的源输入流,如文件输入流;
2) 通过对象输入流的readObject()方法读取对象。
对象序列化和反序列示例:
定义一个Person类,实现Serializable接口
1 import java.io.Serializable; 2 3 public class Person implements Serializable { 4 5 private static final long serialVersionUID = 4603642343377807741L; 6 private int age; 7 private String name; 8 private String sex; 9 10 public int getAge() { 11 return age; 12 } 13 14 public void setAge(int age) { 15 this.age = age; 16 } 17 18 public String getName() { 19 return name; 20 } 21 22 public void setName(String name) { 23 this.name = name; 24 } 25 26 public String getSex() { 27 return sex; 28 } 29 30 public void setSex(String sex) { 31 this.sex = sex; 32 } 33 }
序列化和反序列化Person类对象
1 import java.io.*; 2 import java.text.MessageFormat; 3 4 public class TestObjSerializeAndDeserialize { 5 6 public static void main(String[] args) throws Exception { 7 SerializePerson();//序列化Person对象 8 Person p = DeserializePerson();//反序列Perons对象 9 System.out.println(MessageFormat.format("name={0},age={1},sex={2}", 10 p.getName(), p.getAge(), p.getSex())); 11 } 12 13 14 private static void SerializePerson() throws FileNotFoundException, IOException { 15 Person person = new Person(); 16 person.setName("gacl"); 17 person.setAge(25); 18 person.setSex("男"); 19 // ObjectOutputStream 对象输出流,将Person对象存储到E盘的Person.txt文件中,完成对Person对象的序列化操作 20 ObjectOutputStream oo = new ObjectOutputStream(new FileOutputStream(new File("E:/Person.txt"))); 21 oo.writeObject(person); 22 System.out.println("Person对象序列化成功!"); 23 oo.close(); 24 } 25 26 private static Person DeserializePerson() throws Exception, IOException { 27 ObjectInputStream ois = new ObjectInputStream(new FileInputStream(new File("E:/Person.txt"))); 28 Person person = (Person) ois.readObject(); 29 System.out.println("Person对象反序列化成功!"); 30 return person; 31 } 32 33 } 34
代码运行结果
序列化Person成功后在E盘生成了一个Person.txt文件,而反序列化Person是读取E盘的Person.txt后生成了一个Person对象。
serialVersionUID的作用
serialVersionUID: 字面意思上是序列化的版本号,凡是实现Serializable接口的类都有一个表示序列化版本标识符的静态变量
1 private static final long serialVersionUID
如何生成serialVersionUID?
在eclipse环境下,实现Serializable接口的类假设类中没有加入serialVersionUID。那么就会出现例如以下的警告提示:
用鼠标点击就会弹出生成serialVersionUID的对话框。
serialVersionUID两种生成方式
- 采用
这样的方式生成的serialVersionUID是1L,比如:
1 private static final long serialVersionUID = 1L;
- 采用
这样的方式生成的serialVersionUID是依据类名,接口名。方法和属性等来生成的,比如:
1 private static final long serialVersionUID = 4603642343377807741L;
加入了之后就不会出现那个警告提示了。例如以下所看到的:
serialVersionUID的作用举例:
执行下面的代码
1 public class TestSerialVersionUID { 2 public static void main(String[] args) throws Exception { 3 SerializeCustomer();// 序列化Customer对象 4 Customer customer = DeserializeCustomer();// 反序列Customer对象 5 System.out.println(customer); 6 } 7 8 private static void SerializeCustomer() throws FileNotFoundException, IOException { 9 Customer customer = new Customer("gacl", 25); 10 // ObjectOutputStream 对象输出流 11 ObjectOutputStream oo = new ObjectOutputStream(new FileOutputStream( 12 new File("E:/Customer.txt"))); 13 oo.writeObject(customer); 14 System.out.println("Customer对象序列化成功!"); 15 oo.close(); 16 } 17 18 private static Customer DeserializeCustomer() throws Exception, IOException { 19 ObjectInputStream ois = new ObjectInputStream(new FileInputStream( 20 new File("E:/Customer.txt"))); 21 Customer customer = (Customer) ois.readObject(); 22 System.out.println("Customer对象反序列化成功!"); 23 return customer; 24 } 25 26 } 27 28 class Customer implements Serializable { 29 //Customer类中没有定义serialVersionUID 30 private String name; 31 private int age; 32 33 public Customer(String name, int age) { 34 this.name = name; 35 this.age = age; 36 } 37 @Override 38 public String toString() { 39 return "name=" + name + ", age=" + age; 40 } 41 }
运行结果:
序列化和反序列化都成功了。
修改一下Customer类,添加多一个sex属性
1 class Customer implements Serializable { 2 3 //Customer类中没有定义serialVersionUID 4 private String name; 5 private int age; 6 //新添加的sex属性 7 private String sex; 8 9 public Customer(String name, int age) { 10 this.name = name; 11 this.age = age; 12 } 13 14 public Customer(String name, int age, String sex) { 15 this.name = name; 16 this.age = age; 17 this.sex = sex; 18 } 19 20 @Override 21 public String toString() { 22 return "name=" + name + ", age=" + age; 23 } 24 }
执行反序列操作,此时就会抛出如下的异常信息:
1 Exception in thread "main" java.io.InvalidClassException: Customer; local class incompatible: 2 stream classdesc serialVersionUID = -88175599799432325, local class serialVersionUID = -5182532647273106745
上面异常的意思是说,文件流中的class和classpath中的class,也就是修改过后的class,不兼容了,处于安全机制考虑,程序抛出了错误,并且拒绝载入。那么如果我们真的有需求要在序列化后添加一个字段或者方法呢?应该怎么办?那就是自己去指定serialVersionUID。在TestSerialversionUID例子中,没有指定Customer类的serialVersionUID的,那么java编译器会自动给这个class进行一个摘要算法,类似于指纹算法,只要这个文件 多一个空格,得到的UID就会截然不同的,可以保证在这么多类中,这个编号是唯一的。所以,添加了一个字段后,由于没有显指定 serialVersionUID,编译器又为我们生成了一个UID,当然和前面保存在文件中的那个不会一样了,于是就出现了2个序列化版本号不一致的错误。因此,只要我们自己指定了serialVersionUID,就可以在序列化后,去添加一个字段,或者方法,而不会影响到后期的还原,还原后的对象照样可以使用,而且还多了方法或者属性可以用。
下面继续修改Customer类,给Customer指定一个serialVersionUID,修改后的代码如下:
1 class Customer implements Serializable { 2 3 private static final long serialVersionUID = -3907552831844917246L; 4 5 //Customer类中没有定义serialVersionUID 6 private String name; 7 private int age; 8 //新添加的sex属性 9 // private String sex; 10 11 public Customer(String name, int age) { 12 this.name = name; 13 this.age = age; 14 } 15 16 // public Customer(String name, int age, String sex) { 17 // this.name = name; 18 // this.age = age; 19 // this.sex = sex; 20 // } 21 22 @Override 23 public String toString() { 24 return "name=" + name + ", age=" + age; 25 } 26 }
重新执行序列化操作,将Customer对象序列化到本地硬盘的Customer.txt文件存储,然后修改Customer类,添加sex属性,修改后的Customer类代码如下:
1 class Customer implements Serializable { 2 3 private static final long serialVersionUID = -3907552831844917246L; 4 5 //Customer类中没有定义serialVersionUID 6 private String name; 7 private int age; 8 //新添加的sex属性 9 private String sex; 10 11 public Customer(String name, int age) { 12 this.name = name; 13 this.age = age; 14 } 15 16 public Customer(String name, int age, String sex) { 17 this.name = name; 18 this.age = age; 19 this.sex = sex; 20 } 21 22 @Override 23 public String toString() { 24 return "name=" + name + ", age=" + age; 25 } 26 }
执行反序列操作,这次就可以反序列成功了。
serialVersionUID的取值
serialVersionUID的取值是Java运行时环境根据类的内部细节自动生成的。如果对类的源代码作了修改,再重新编译,新生成的类文件的serialVersionUID的取值有可能也会发生变化。类的serialVersionUID的默认值完全依赖于Java编译器的实现,对于同一个类,用不同的Java编译器编译,有可能会导致不同的 serialVersionUID,也有可能相同。为了提高serialVersionUID的独立性和确定性,强烈建议在一个可序列化类中显示的定义serialVersionUID,为它赋予明确的值。
显式地定义serialVersionUID有两种用途:
- 在某些场合,希望类的不同版本对序列化兼容,因此需要确保类的不同版本具有相同的serialVersionUID;
- 在某些场合,不希望类的不同版本对序列化兼容,因此需要确保类的不同版本具有不同的serialVersionUID;
友情推荐:
java基础---->Serializable的使用:http://www.cnblogs.com/huhx/p/serializable.html
java高级---->Serializable的过程分析:http://www.cnblogs.com/huhx/p/serializable.html
hive序列化官方文档:https://cwiki.apache.org/confluence/display/Hive/DeveloperGuide#DeveloperGuide-HiveSerDe