这篇随笔对应的.Net命名空间是System.Xml.Serialization;文中的示例代码需要引用这个命名空间。
为什么要做序列化和反序列化?
.Net程序执行时,对象都驻留在内存中;内存中的对象如果需要传递给其他系统使用;或者在关机时需要保存下来以便下次再次启动程序使用就需要序列化和反序列化。
范围:本文只介绍xml序列化,其实序列化可以是二进制的序列化,也可以是其他格式的序列化。
看一段最简单的Xml序列化代码
1 2 3 4 5 6 7 8 9 10 11 12 |
|
上面代码对int i进行了序列化,并将序列化的结果输出到了控制台,输出结果如下
|
可以将上述序列化的xml进行反序列化,如下代码
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
|
以上代码用最简单的方式说明了xml序列化和反序列化的过程,.Net系统类库为我们做了大量的工作,序列化和反序列化都非常简单。但是在现实中业务需求往往比较复杂,不可能只简单的序列化一个int变量,显示中我们需要对复杂类型进行可控制的序列化。
自定义对象的Xml序列化:
System.Xml.Serialization命名空间中有一系列的特性类,用来控制复杂类型序列化的控制。例如XmlElementAttribute、XmlAttributeAttribute、XmlArrayAttribute、XmlArrayItemAttribute、XmlRootAttribute等等。
看一个小例子,有一个自定义类Cat,Cat类有三个属性分别为Color,Saying,Speed。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 |
|
可以使用XmlElement指定属性序列化为子节点(默认情况会序列化为子节点);或者使用XmlAttribute特性制定属性序列化为Xml节点的属性;还可以通过XmlIgnore特性修饰要求序列化程序不序列化修饰属性。
对象数组的Xml序列化:
数组的Xml序列化需要使用XmlArrayAttribute和XmlArrayItemAttribute;XmlArrayAttribute指定数组元素的Xml节点名,XmlArrayItemAttribute指定数组元素的Xml节点名。
如下代码示例:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 |
|
以上代码将输出:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
|
XmlSerializer内存泄漏问题:
多谢chenlulouis,仔细看了下msdn,确实存在泄漏的情况,msdn说明如下:
动态生成的程序集
为了提高性能,XML 序列化基础结构将动态生成程序集,以序列化和反序列化指定类型。此基础结构将查找并重复使用这些程序集。此行为仅在使用以下构造函数时发生:
XmlSerializer(Type)
XmlSerializer.XmlSerializer(Type, String)
如果使用任何其他构造函数,则会生成同一程序集的多个版本,且绝不会被卸载,这将导致内存泄漏和性能降低。最简单的解决方案是使用先前提到的两个构造函数的其中一个。否则,必须在 Hashtable 中缓存程序集,如以下示例中所示。
也就是说我们在使用XmlSerializer序列化,初始化XmlSerializer对象时最好使用下面两个构造函数否则会引起内存泄漏。
XmlSerializer(Type)
XmlSerializer.XmlSerializer(Type, String)
不错,之前研究了XML文件转类,现在看到了LZ的类-->XML,不错,学习了,继续加油.
1 2 3 4 5 6 7 8 9 10 |
|
这样会不会更好?
1 2 3 4 5 6 |
|
@ 首席技术官
这样生成的xml确实更简洁,谢谢提示。
我文中的例子是展示XmlArrayAttribute和XmlArrayItemAttribute用法的,所以生成的xml就是那个样子了。不管怎样,谢谢。
很好,浅显易懂!
#6楼 2011-07-22 11:10 | chenlulouis
XmlSerializer 要慎用, 容易引起动态加载dll泄漏
引用chenlulouis:XmlSerializer 要慎用, 容易引起动态加载dll泄漏
我知道XmlSerializer生成一个dll,但是从来没有遇到过你说的问题,可否详细说明?
#8楼 2011-07-22 11:32 | chenlulouis
印象中,每次调用 xmlserialzer 构造的时候,应用程序域都会动态加载序列化类型的dll, 这样长期运行会加载很多dll而不会卸载(除非应用程序欲卸载),最终结果是 你托管堆和GC 都很小 但是内存很大 都被DLL占用了
@ chenlulouis
按你这么说那是一个大bug呀,xml序列化从.net1就开始有了,微软不会让这个bug一直存在吧?
#10楼 2011-07-22 13:56 | chenlulouis
http://msdn.microsoft.com/zh-cn/library/system.xml.serialization.xmlserializer%28VS.95%29.aspx
这里有关于泄漏的说明
引用首席技术官:[code=html]
<?xml version="1.0" encoding="gb2312"?>
<cats xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://ww
w.w3.org/2001/XMLSchema">
<cat color="White">
<saying>White or black, so long as the cat can catch mice, it is a good cat</saying>
</cat>
...
代码非常好看,优化不错
#12楼[楼主] 2011-07-22 15:25 | 玉开
引用chenlulouis:http://msdn.microsoft.com/zh-cn/library/system.xml.serialization.xmlserializer%28VS.95%29.aspx
这里有关于泄漏的说明
谢谢你,chenlulouis,仔细看了下msdn,确实存在泄漏的情况,msdn说明如下:
[I]
动态生成的程序集
为了提高性能,XML 序列化基础结构将动态生成程序集,以序列化和反序列化指定类型。此基础结构将查找并重复使用这些程序集。此行为仅在使用以下构造函数时发生:
XmlSerializer(Type)
XmlSerializer.XmlSerializer(Type, String)
如果使用任何其他构造函数,则会生成同一程序集的多个版本,且绝不会被卸载,这将导致内存泄漏和性能降低。最简单的解决方案是使用先前提到的两个构造函数的其中一个。否则,必须在 Hashtable 中缓存程序集,如以下示例中所示。
[/I]
也就是说我们在使用XmlSerializer序列化,初始化XmlSerializer对象时最好使用下面两个构造函数否则会引起内存泄漏。
XmlSerializer(Type)
XmlSerializer.XmlSerializer(Type, String)