读取XML的三种方式,及其性能分析和比较

今天在csdn看到这个帖子: 这段XML怎么解析?

我选择了我认为最方便而高效的方式,用DOM的方式解析,就像这样:

XmlDocument xmldoc = new XmlDocument();
xmldoc.Load(...);
string ns = "http://schemas.xmlsoap.org/soap/envelope/";
XmlNode envelope = xmldoc["Envelope",ns];
XmlNode body = envelope["Body",ns];
XmlNode req = body["SyncOrderRelationReq"];
XmlNode linkId = req["LinkID"];
Console.WriteLine(linkId.InnerXml);

有朋友认为用XPath更好。这个我也知道,在XML的整个体系中,XPath是目前查询XML的专用语言,在这种情况下,自然最“标准”。

不过我认为由于XPath多了一个解析XPath表达式的过程,会比较慢,所以用DOM的方式更好。于是写了个性能测试代码,包含DOM, XPath, XmlReader三者的对比,以作证明:

这个XML文件还包含了名称空间,在比较“正规”的情况下,确实是这种情况。
测试结果是(K8 2800+ 64bit, 512M DDR400):

XPathTest: 00:00:02.8281250
DOMTest: 00:00:00.3750000
XmlReaderTest: 00:00:13.5156250

和我的预期相符,XPath远远慢于DOM的方式,几乎差了一个数量级。

有意思的是,用XmlReader的方式按理说最快,结果这里变成了最慢。实际上,对于最后一个测试,这里有点不公平,因为XmlDocument.Load的时候已经对XML进行了遍历,然后就建立了缓存。而XmlReader每次都需要这种Load的过程,并且没有缓存。如果把加载XML的时间考虑在内,XmlReader才是最快的。另外一个方面,由于它是一种只进只读的方式,使用XmlReader可以节省内存;而对于特别大的XML文件,比如达到数百M,XmlReader就成了唯一可行的方案。

-----

update on 4/14/2005:
今天我感觉到把DOM方式和XPath方式区分开,这个名字不太好,因为用XPath查询时,本质上也是用DOM的。所以上面第二个测试,DOMTest,应该称之为手动在DOM导航的测试,而XPathTest,相当于提供一个命令,像SQL语句那样动态编译后,自动在DOM导航。

update on 4/19/2005:
处理XML里面的名称空间确实是个很麻烦的问题,在上面的例子里面,使用了XmlNamespaceManager类来处理。而在XSL/T里面,又有个小技巧(还是基于那个XML):

<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
 xmlns:xsd="http://www.w3.org/2001/XMLSchema"
 xmlns:SOAP-ENV="http://schemas.xmlsoap.org/soap/envelope/"
 xmlns:SOAP-ENC="http://schemas.xmlsoap.org/soap/encoding/"
 xmlns:REQ="http://www.monternet.com/dsmp/schemas/">
 <xsl:output method="xml" />
 <xsl:template match="/">
  <xsl:value-of select="SOAP-ENV:Envelope/SOAP-ENV:Body/REQ:SyncOrderRelationReq/REQ:LinkID" />
 </xsl:template>
</xsl:stylesheet>

注意REQ这个名称空间的简写是我自己定义的,原来的XML文件没有

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: tinyxml2是一个开源的、轻量级的XML解析库。它是对C++标准库的简单封装,用于处理XML文件的读取、解析以及创建和修改XML文件。 tinyxml2库具有以下特点和功能: 1. 易于使用:tinyxml2库的API设计简单、易于理解和操作,可以方便地读取和解析XML文件中的数据。 2. 快速且内存占用低:tinyxml2库使用了基于迭代器的解析算法,解析速度快,而且内存占用较小。 3. 跨平台兼容性:tinyxml2库可以在不同的操作系统和编译器上运行,具有良好的跨平台兼容性。 4. 支持Unicode:tinyxml2库支持Unicode编码的XML文件,可以正确地处理各种国际化字符。 5. 支持创建和修改XML文件:tinyxml2库可以方便地创建和修改XML文件,可以添加、删除和修改XML节点及其属性。 6. 错误处理能力强:tinyxml2库提供了丰富的错误处理机制,可以捕获和处理解析XML文件中的错误。 7. 可靠性高:tinyxml2库在解析XML文件时具有良好的鲁棒性,可以处理复杂的XML文件结构和错误格式的XML文件。 总之,tinyxml2是一个功能强大、可靠高效的XML解析库,适用于各种C++项目中需要处理XML文件的场景。无论是读取、解析、创建还是修改XML文件,tinyxml2都提供了简单易用的API,并且具有较好的跨平台兼容性和Unicode支持。 ### 回答2: TinyXML2是一个轻量级的C++库,用于解析和生成XML文档。它是TinyXML库的升级版本,提供了更好的性能和易于使用的API。 TinyXML2具有简单直观的接口,支持XML的基本操作,如加载、解析、访问和修改XML文档。它提供了一些类和函数,可以方便地在代码中处理XML数据。 TinyXML2支持从文件、字符串和内存中加载XML文档。它可以解析XML元素、属性、文本内容和注释,并提供了访问和修改这些数据的接口。用于访问和修改XML数据的API是面向对象的,使得操作XML文档更加方便和直观。 TinyXML2还提供了将XML文档序列化为字符串的功能,以及将XML数据写入到文件中的功能。这使得可以方便地将XML文档保存到文件或其他储存介质中,或者将XML数据通过网络传输。 TinyXML2使用C++语言编写,具有良好的可移植性和跨平台性。它不依赖于任何外部库,只需要包含头文件即可使用。这使得它非常适合用于嵌入式系统或其他资源有限的环境中。 总之,TinyXML2是一个功能强大、易于使用的C++库,用于解析和生成XML文档。它提供了简单直观的API,支持XML的基本操作,同时具有良好的可移植性和跨平台性。无论是在桌面应用程序、嵌入式系统还是其他需要处理XML的项目中,TinyXML2都是一个很好的选择。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值