简单来说序列化就是一种用来处理对象流的机制,所谓对象流也就是将对象的内容进行流化,流的概念这里不用多说(就是I/O),我们可以对流化后的对象进行读写操作,也可将流化后的对象传输于网络之间(注:要想将对象传输于网络必须进行流化)!在对对象流进行读写操作时会引发一些问题,而序列化机制正是用来解决这些问题的!
如上所述,读写对象会有什么问题呢?比如:我要将对象写入一个磁盘文件而后再将其读出来会有什么问题吗?别急,其中一个最大的问题就是对象引用!举个例子来说:假如我有两个类,分别是A和B,B类中含有一个指向A类对象的引用,现在我们对两个类进行实例化{ A a = new A(); B b = new B(); },这时在内存中实际上分配了两个空间,一个存储对象a,一个存储对象b,接下来我们想将它们写入到磁盘的一个文件中去,就在写入文件时出现了问题!因为对象b包含对对象a的引用,所以系统会自动的将a的数据复制一份到b中,这样的话当我们从文件中恢复对象时(也就是重新加载到内存中)时,内存分配了三个空间,而对象a同时在内存中存在两份,想一想后果吧,如果我想修改对象a的数据的话,那不是还要搜索它的每一份拷贝来达到对象数据的一致性,这不是我们所希望的!
以下序列化机制的解决方案:
1.保存到磁盘的所有对象都获得一个序列号(1, 2, 3等等)
2.当要保存一个对象时,先检查该对象是否被保存了。
3.如果以前保存过,只需写入"与已经保存的具有序列号x的对象相同"的标记,否则,保存该对象
通过以上的步骤序列化机制解决了对象引用的问题!
序列化的实现
将需要被序列化的类实现Serializable接口,该接口没有需要实现的方法,implements Serializable只是为了标注该对象是可被序列化的,然后使用一个输出流(如:FileOutputStream)来构造一个ObjectOutputStream(对象流)对象,接着,使用ObjectOutputStream对象的writeObject(Object obj)方法就可以将参数为obj的对象写出(即保存其状态),要恢复的话则用输入流。
修改默认的序列化机制
在序列化的过程中,有些数据字段我们不想将其序列化,对于此类字段我们只需要在定义时给它加上transient关键字即可,对于transient字段序列化机制会跳过不会将其写入文件,当然也不可被恢复。但有时我们想将某一字段序列化,但它在SDK中的定义却是不可序列化的类型,这样的话我们也必须把他标注为transient,可是不能写入又怎么恢复呢?好在序列化机制为包含这种特殊问题的类提供了如下的方法定义:
private void readObject(ObjectInputStream in) throws
IOException, ClassNotFoundException;
private void writeObject(ObjectOutputStream out) throws
IOException;
(注:这些方法定义时必须是私有的,因为不需要你显示调用,序列化机制会自动调用的)
使用以上方法我们可以手动对那些你又想序列化又不可以被序列化的数据字段进行写出和读入操作。
下面是一个典型的例子,java.awt.geom包中的Point2D.Double类就是不可序列化的,因为该类没有实现Serializable接口,在我的例子中将把它当作LabeledPoint类中的一个数据字段,并演示如何将其序列化!
- import java.io.*;
- import java.awt.geom.*;
- public class TransientTest
- {
- public static void main(String[] args)
- {
- LabeledPoint label = new LabeledPoint("Book", 5.00, 5.00);
- try
- {
- System.out.println(label);//写入前
- ObjectOutputStream out = new ObjectOutputStream(new
- FileOutputStream("Label.txt"));
- out.writeObject(label);
- out.close();
- System.out.println(label);//写入后
- ObjectInputStream in = new ObjectInputStream(new
- FileInputStream("Label.txt"));
- LabeledPoint label1 = (LabeledPoint)in.readObject();
- in.close();
- System.out.println(label1);//读出并加1.0后
- }
- catch (Exception e)
- {
- e.printStackTrace();
- }
- }
- }
- class LabeledPoint implements Serializable
- {
- public LabeledPoint(String str, double x, double y)
- {
- label = str;
- point = new Point2D.Double(x, y);
- }
- private void writeObject(ObjectOutputStream out) throws IOException
- {
- /**
- *必须通过调用defaultWriteObject()方法来写入
- *对象的描述以及那些可以被序列化的字段
- */
- out.defaultWriteObject();
- out.writeDouble(point.getX());
- out.writeDouble(point.getY());
- }
- private void readObject(ObjectInputStream in)
- throws IOException, ClassNotFoundException
- {
- /**
- *必须调用defaultReadObject()方法
- */
- in.defaultReadObject();
- double x = in.readDouble() + 1.0;
- double y = in.readDouble() + 1.0;
- point = new Point2D.Double(x, y);
- }
- public String toString()
- {
- return getClass().getName()
- + "[label = "+ label
- + ", point.getX() = "+ point.getX()
- + ", point.getY() = "+ point.getY()
- + "]";
- }
- private String label;
- transient private Point2D.Double point;
- }
为什么不是所有的类都序列化?
很重要的一个原因就是为了安全,java的类安全机制是做的很好的.
对于一个你要传输的对象,比如写到文件,或者进行rmi传输等等,在传输的过程中,
这个对象的private等域是不受保护的.
还有就是一些资源分配的问题,比如thread,序列化是很难对他重新分配资源,
所以并非所有的类都可以序列化.
实现java.io.Serializable这个接口是为序列化,serialVersionUID 用来表明实现序列化类的不同版本间的兼容性。如果你修改了此类, 要修改此值。否则以前用老版本的类序列化的类恢复时会出错。 实现后如果你用的是工具的话会出来警告,他会提示你,可以自动生成private static final long serialVersionUID = 1L; 为了在反序列化时,确保类版本的兼容性,最好在每个要序列化的类中加入private static final long serialVersionUID这个属性,具体数值自己定义. 在JDK中,可以利用JDK的bin目录下的serialver.exe工具产生这个serialVersionUID,如对于Test.class可执行如下命令:serialver Test。 这样,即使某个类在与之对应的对象已经序列化出去后做了修改,该对象依然可以被正确反序列化。否则,如果不显式定义该属性,这个属性值将由JVM根据类的相关信息计算,而修改后的类的计算结果与修改前的类的计算结果往往不同,从而造成对象的反序列化因为类版本不兼容而失败。 不显式定义这个属性值的另一个坏处是,不利于程序在不同的JVM之间的移植。因为不同的编译器实现该属性值的计算策略可能不同,从而造成虽然类没有改变,但是因为JVM不同,出现因类版本不兼容而无法正确反序列化的现象出现。 当我们的系统不太经常需要序列化类时,可以去掉这些警告,做如下设置:Window-->Preferences-->Java,将serializable class without serialVersionUID的设置由warning改为Ignore。然后Eclipse会重新编译程序,那些警告信息也就消失了。 最后的建议是,如果我们开发大量需要序列化的类的时候,我们最好还是还原为原来的设置。这样可以保证系统的性能和健壮。 关于serialVersionUID的解释 serialVersionUID作用: 序列化时为了保持版本的兼容性,即在版本升级时反序列化仍保持对象的唯一性。 你可以随便写一个,在Eclipse中它替你生成一个,有两种生成方式: 一个是默认的1L,比如:private static final long serialVersionUID = 1L; 一个是根据类名、接口名、成员方法及属性等来生成一个64位的哈希字段,比如:private static final long serialVersionUID = -8940196742313994740L;之类的。 Eclipse提示The serializable class XXX does not declare a static final serialVersionUID field of type long 那是Eclipse提供这个提示功能给你吧. 你点它warning的icon两下Eclipse就会自动给定. 如果你不喜欢,可以把它关掉, windows -> preferences -> compiler -> Error/Warnings -> Potential Programming problems 将Serializable class without serialVersionUID的warning改成ignore. 其实如果你没有考虑到兼容性问题时,那就把它关掉吧. 其实有这个功能是好的. 只要任何类别实作了Serializable这个介面, 如果没有加入serialVersionUID,Eclipse都会给你warning提示, 这个serialVersionUID为了让该类别Serializable後兼容. 考虑一下,如果今天你的类Serialized存到硬碟里, 可是後来你却更改了类别的field(增加或减少或改名). 当你Deserialize时,就会出现Exception.这样就会做成不兼容性的问题. 但当serialVersionUID相同时,它就会将不一样的field以type的预设值Deserialize. 这个可以避开不兼容性的问题. 异常状态: The serializable class XXX does not declare a static final serialVersionUID field of type long