VC操作XML的基本流程

最新推荐文章于 2016-06-16 09:06:14 发布

Michael@Wu

最新推荐文章于 2016-06-16 09:06:14 发布

阅读量1.7k

点赞数

分类专栏：程序 VC++ 文章标签： vc++ xml C++

本文链接：https://blog.csdn.net/Jeremy_W/article/details/23820731

版权

程序同时被 2 个专栏收录

16 篇文章 0 订阅

订阅专栏

VC++

7 篇文章 0 订阅

订阅专栏

基本概念

XML的编程模式
前面我们说过，XML对树的表达能力是很强大的，我们完全可以把一个XML文档用一个树来表达，对于文档的操作就是对树的操作，这就是DOM（文档对象模型）。然而，DOM对XML文档的处理有许多的毛病，比如速度慢等，于是有了另一种模型SAX.
下面，我们分别详细的对这两种模型进行说明。
DOM模型
DOM模型需要对整个XML文档进行扫描，然后解析生成一个对象树，XML文档中的所有标签和属性都是用对象来表示，而不是一个孤立的文本。因为是对象，所以有一个上下文，有一个包含关系。
基本是这样的
Doc
Element
Note
Text
Doc是指整个树对象，包括了基本的属性。
Element是指的一个标签，可以包含属性(Attribute)和子节点（ChilNode）的节点对象。
Note也是一个标签，不过不能包含子节点和属性。
Text就是简单的文本。
既然是树操作，就要包含节点的添、删和浏览等基本的功能。利用这些功能，就可以完全对XML文档进行操作了。对象级的操作，比起直接对文本操作要容易得多，也要直观得多。
SAX模型
我们说了，DOM模型的缺点就是速度慢，和浪费内存。因为在许多的情况下，我们并不需要对整个的XML文档进行扫描。而仅仅需要其中的某些信息，这时候就没有必有生成一个庞大的树结构了，特别是当文件很大的时候。

SAX模型，就是对XML文档边扫描，边处理。类似于许多的程序设计思想，SAX是事件驱动的。这个意思是说，它可以在处理的过程中生成不同的消息，并调用相应的函数进行处理。并可以在中途退出，这一点非常重要。比如网页在下载的过程中，就可以一边下载，一边把已下部分进行解析显示。

根据不同的情况，我们采用不同的方法进行处理。

应该说明的是，XML的这些模型都是标准化组织定义的，而不是某个公司的规范。所以，程序的移植应该比较的方便。

XML编程举例

由于Microft XML Parser的文档比较的全面，而且和Visual C++的结合比较紧密，我们这里就以这样的组合来进行举例，对于别的语言，可以举一反三。

对Microsoft XML Parser的一点说明：

所有的对象都是COM对象。为此，我们使用SmartPointer来减少AddRef,ReleaseRef的麻烦。同样，因为使用的字符串统一是BSTR类型的，内存的释放也是一个比较麻烦的事情，所以用_bstr_t 类来对BSTR数据类型进行封装，可以减少不必要的麻烦。

DOM模型：

前面已经说了，对于DOM模型来说，整个XML文件被解析成一个树形的结构。所有的标签、属性等都被当作对象来看待。所以，必须了解清楚对象的含义，及其相互关系，方能正确操作。

DOM模型：

前面已经说了，对于DOM模型来说，整个XML文件被解析成一个树形的结构。所有的标签、属性等都被当作对象来看待。所以，必须了解清楚对象的含义，及其相互关系，方能正确操作。

为了先有一个感性认识，让我们开始吧。（为了方便说明，代码里基本上没有异常处理）

生成一个XML文本

假设我们要创建一个如下的XML文本

-11

9

我们首先应该先创建一个Document对象，如下：MSXML::IXMLDOMDocumentPtr pDoc;

pDoc.CreateInstance(__uuidof(MSXML::DOMDocument));

如果创建成功，那么我们就会得到一个XMLDOMDocument对象实例。下一步就是添加根节点DocumentElement，记住XML只有一个根。

创建Element对象作为根节点

MSXML::IXMLDOMElementPtr pDocElement=pDoc->createElement("China");

把根节点插入到目录树中

pDoc->appendChild(pDocElement);

好了，生成一个树根了，我们现在来看一看结果：用pDoc -> xml 可以取得整个DOM对象的文本因为树根下没有任何东西，所以只显示现在，我们要在树根下插入子节点，并设置节点文本(Text)

MSXML::IXMLDOMElementPtr pNewChildElement;
pNewChildElement=pDoc->createElement("Beijing");
pNewChildElement->Puttext("-11");
pDocElement->appendChild(pNewChildElement);
这时候整个的 XML文本应该为

-11

再增加一个子节点，并设置节点属性(Attribute)pNewChildElement=pDoc->createElement("Shanghai");
pNewChildElement->Puttext("9");
pNewChildElement->setAttribute("Weather",_variant_t("Cloudy")); pDocElement->appendChild(pNewChildElement);

于是，我们就可以得到预期的XML文本了。
其他的操作：
删除操作：
从父节点来删除子节点pDocElement->removeChild(pNewChildElement)
存盘操作：
pDoc->Save();
装载已有XML文本
如果我们已经有了一个XML文件，想对其进行解析，那么可以使用Document 对象的Load或LoadXML来进行加载，并在加载的同时进行语法分析。

如果加载成功，那么就会在内存中生成一个树形结构。利用DOM模型，我们就可以进行各种操作。最常见的是，我们需要寻找特定的信息，并进行处理。

查找定位

使用SelectSingleNode (XPath),SelectNodes(XPath)来定位标签，取得对应的Node(s)对象。

XPath

XPath是类似于文件路径名的字符串，也像SQL的查询语句,可以限定查找范围。

找到指定对象，我们就可各种处理了，添加、删除、取值等等。

小结：上面仅仅是对DOM模型的编程进行了简单的介绍，以期快速入门。要详细了解，还必须查阅SDK的文档。如果可能，将在以后介绍SAX 模型、XSLT对 XML的转换等