VC操作XML的基本流程

7 篇文章 0 订阅

基本概念 


XML的编程模式 
前面我们说过,XML对树的表达能力是很强大的,我们完全可以把一个XML文档用一个树来表达,对于文档的操作就是对树的操作,这就是DOM(文档对象模型)。然而,DOM对XML文档的处理有许多的毛病,比如速度慢等,于是有了另一种模型SAX. 
下面,我们分别详细的对这两种模型进行说明。 
 DOM模型 
DOM模型需要对整个XML文档进行扫描,然后解析生成一个对象树,XML文档中的所有标签和属性都是用对象来表示,而不是一个孤立的文本。因为是对象,所以有一个上下文,有一个包含关系。 
基本是这样的 
Doc 
Element 
Note 
Text 
Doc是指整个树对象,包括了基本的属性。 
Element是指的一个标签,可以包含属性(Attribute)和子节点(ChilNode)的节点对象。 
Note也是一个标签,不过不能包含子节点和属性。 
Text就是简单的文本。 
既然是树操作,就要包含节点的添、删和浏览等基本的功能。利用这些功能,就可以完全对XML文档进行操作了。对象级的操作,比起直接对文本操作要容易得多,也要直观得多。 
SAX模型 
我们说了,DOM模型的缺点就是速度慢,和浪费内存。因为在许多的情况下,我们并不需要对整个的XML文档进行扫描。而仅仅需要其中的某些信息,这时候就没有必有生成一个庞大的树结构了,特别是当文件很大的时候。 

SAX模型,就是对XML文档边扫描,边处理。类似于许多的程序设计思想,SAX是事件驱动的。这个意思是说,它可以在处理的过程中生成不同的消息,并调用相应的函数进行处理。并可以在中途退出,这一点非常重要。比如网页在下载的过程中,就可以一边下载,一边把已下部分进行解析显示。 

根据不同的情况,我们采用不同的方法进行处理。 

应该说明的是,XML的这些模型都是标准化组织定义的,而不是某个公司的规范。所以,程序的移植应该比较的方便。 

XML编程举例 

由于Microft XML Parser的文档比较的全面,而且和Visual C++的结合比较紧密,我们这里就以这样的组合来进行举例,对于别的语言,可以举一反三。 

对Microsoft XML Parser的一点说明: 

所有的对象都是COM对象。为此,我们使用SmartPointer来减少AddRef,ReleaseRef的麻烦。同样,因为使用的字符串统一是BSTR类型的,内存的释放也是一个比较麻烦的事情,所以用_bstr_t 类来对BSTR数据类型进行封装,可以减少不必要的麻烦。 

DOM模型: 

前面已经说了,对于DOM模型来说,整个XML文件被解析成一个树形的结构。所有的标签、属性等都被当作对象来看待。所以,必须了解清楚对象的含义,及其相互关系,方能正确操作。 

DOM模型: 

前面已经说了,对于DOM模型来说,整个XML文件被解析成一个树形的结构。所有的标签、属性等都被当作对象来看待。所以,必须了解清楚对象的含义,及其相互关系,方能正确操作。 

为了先有一个感性认识,让我们开始吧。(为了方便说明,代码里基本上没有异常处理) 

生成一个XML文本 

假设我们要创建一个如下的XML文本 


-11 




我们首先应该先创建一个Document对象,如下:MSXML::IXMLDOMDocumentPtr pDoc; 

pDoc.CreateInstance(__uuidof(MSXML::DOMDocument)); 

如果创建成功,那么我们就会得到一个XMLDOMDocument对象实例。下一步就是添加 根节点DocumentElement,记住XML只有一个根。 

创建Element对象作为根节点 

MSXML::IXMLDOMElementPtr pDocElement=pDoc->createElement("China"); 

把根节点插入到目录树中 

pDoc->appendChild(pDocElement); 

好了,生成一个树根了,我们现在来看一看结果:用pDoc -> xml 可以取得整个DOM对象的文本 因为树根下没有任何东西,所以只显示现在,我们要在树根下插入子节点,并设置节点文本(Text) 

MSXML::IXMLDOMElementPtr pNewChildElement; 
pNewChildElement=pDoc->createElement("Beijing"); 
pNewChildElement->Puttext("-11"); 
pDocElement->appendChild(pNewChildElement); 
这时候整个的 XML文本应该为 


-11 


再增加一个子节点,并设置节点属性(Attribute)pNewChildElement=pDoc->createElement("Shanghai");
pNewChildElement->Puttext("9");
pNewChildElement->setAttribute("Weather",_variant_t("Cloudy")); pDocElement->appendChild(pNewChildElement); 

于是,我们就可以得到预期的XML文本了。 
其他的操作: 
删除操作: 
从父节点来删除子节点pDocElement->removeChild(pNewChildElement) 
存盘操作: 
pDoc->Save(); 
装载已有XML文本 
如果我们已经有了一个XML文件,想对其进行解析,那么可以使用Document 对象的Load或LoadXML来进行加载,并在加载的同时进行语法分析。 

如果加载成功,那么就会在内存中生成一个树形结构。利用DOM模型,我们就可以进行各种操作。最常见的是,我们需要寻找特定的信息,并进行处理。 

查找定位 

使用SelectSingleNode (XPath),SelectNodes(XPath)来定位标签,取得对应的Node(s)对象。 

XPath 

XPath是类似于文件路径名的字符串,也像SQL的查询语句,可以限定查找范围。 

找到指定对象,我们就可各种处理了,添加、删除、取值等等。 

小结:上面仅仅是对DOM模型的编程进行了简单的介绍,以期快速入门。要详细了解,还必须查阅SDK的文档。如果可能,将在以后介绍SAX 模型、XSLT对 XML的转换等


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值