C++使用tinyXml读取XML

最近在开发的过程中,有个需求是对xml进行格式转化,从一种格式转化到另外一种格式。因此,就需要读取xml进行处理。原本打算写成工具在linux下运行,不过后来考虑到和系统结合,最后也就使用了前台js转了。反正都是读取xml,什么技术转不都是一样的么?

不过刚开始还是对要使用的技术做了一定的探究。c++要读取xml有很多种方式.比较又名的有:

rapidXML(这个是网上介绍的,没用过)

Xerces-C++ XML Parser:通常来说,读取XML的方法都是将整个文本进行读取,然后构建成DOM Tree,之后进行遍历等操作。这个Parser除了支持构建DOM Tree的方式之外,还支持类似于回调函数的方式进行处理(SAX,SAX2),在读到相应的节点然后调用函数进行处理。DOM Tree的方式好处是简单,操作很方便,但是劣势也是很明显:需要把整个XML读进之后才能做处理。如果XML很大,那内存就支撑不住了。SAX,SAX2的作用就在此,其可以支持很大的XML,因为其是相当于事件式的处理方式,不需要构建DOM Tree.不过就是比较麻烦。

TinyXML:这个就是接下来要介绍的库了。取名Tiny,意在编写一个轻量级的处理基本XML的工具。因此,其支持的特性有限。下面列出了其不支持的功能:

TinyXML doesn't parse or use DTDs (Document Type Definitions) or XSLs (eXtensible Stylesheet Language.)                                                           -------------------官方说明文档

其给出的理由也很明确:

1. 支持这两个特性使得库更为庞大

2. 使用更为复杂

3. 学习曲线更曲折

需要使用这些特性的可以考虑上面的xerces-C++ XML Parser,很强大,当然也复杂得多。

TinyXml使用:

前言说的已经够多了,咱们就不废话了,直接讲解tinyXml的使用方法。

安装:

TinyXml的安装方法并不复杂,或者说没有安装这个步骤。

1. 下载tinyXml,下载tinyxml_2_6_2.zip

2. 解压unzip tinyxml_2_6_2.zip。(windows就直接解压就可以了)

对于有vs的朋友来说,直接打开tinyxml.sln就可以了。对于linux用户来说,则需要拷贝上面全出来的6个文件。

PS:顺带的,我觉得可以把它的Makefile也拷出来,写得非常不错,可以参考参考。

使用:

tinyxml的使用方法很简单,只需要把拷出来的文件放在自己编写的目录下面,引用tinyxml.h,tinystr.h即可。

简单示例代码:

1 #include "tinyxml.h"
2 #include "tinystr.h"
3 #include <iostream>
4
5 using namespace std;
6 int main(int argc, char *argv[])
7 {
8 if(argc != 2)
9 {
10 cout << "usage: "<<argv[0] << " xmlfile" << endl;
11 return 1;
12 }
13 TiXmlDocument doc(argv[1]);
14 bool loadOk = doc.LoadFile();
15 if (!loadOk)
16 {
17 cout << "could load:" << doc.ErrorDesc() << endl;
18 }
19 TiXmlPrinter printer;//提供的工具类,目的是将xml的数据按格式输出
20 doc.Accept(&printer);
21 cout << printer.CStr() << endl;//输出
22
23 TiXmlElement*node = doc.FirstChildElement();//获取第一个element节点
24 cout << node->Value() << endl;//输出节点的值
25 string t;
26 node->QueryValueAttribute("type", &t);//获取节点属性
27 cout << t << endl;
28
29 doc.FirstChild()->NextSibling()->ToElement()->QueryStringAttribute("type", &t);//获取第二个子节点的数据
30 cout << "2:" << t << endl;
31
32 //使用遍历的方式进行处理
33 TiXmlNode* child = NULL;
34 TiXmlElement* element = NULL;
35 TiXmlAttribute *attr = NULL;
36 int ct;
37 while(child = doc.FirstChild()->IterateChildren(child))
38 {
39 cout << child->ValueStr() << "\t";
40 ct = child->Type();
41 cout << ct << "\t";
42 //根据不同的节点类型做相应处理
43 switch(ct)
44 {
45 case TiXmlNode::TINYXML_TEXT:
46 break;
47 case TiXmlNode::TINYXML_ELEMENT:
48 element = child->ToElement();
49 attr = element->FirstAttribute();
50 while(attr)
51 {
52 cout << attr->NameTStr() << "=" << attr->ValueStr() << '\t';
53 attr = attr->Next();
54 }
55 break;
56 }
57 }
58
59 return 0;
60 }

编译命令:

1 g++ -c tinyxmlparser.cpp -DTIXML_USE_STL
2 g++ -c tinyxmlerror.cpp -DTIXML_USE_STL
3 g++ -c tinystr.cpp -DTIXML_USE_STL
4 g++ -c tinyxml.cpp -DTIXML_USE_STL
5 g++ -c xmltest.cpp -DTIXML_USE_STL
6 g++ -o xmltest xmltest.o tinyxmlparser.o tinyxmlerror.o tinystr.o tinyxml.o

或者大家可以参考那个Makefile改改。

xml文件:

1 <xml>
2 <tag1 type='1'/>
3 <tag2 type='2'/>
4 </xml>

运行结果:

1 <xml>
2 <tag1 type="1" />
3 <tag2 type="2" />
4 </xml>
5
6 xml
7 :
8 tag1 1 type=1 tag2 1 type=2

没打回车显得比较混乱,将就这看看。

详细解释:

这部分仅仅是我的理解,可能有错,有错的话还请告知我下。

tinyxml按照xml的规定,将所有结点做了区分,我们也可以看到类库中有:

  • TiXmlDocument::文档中的根
  • TiXmlNode: node为文档中所有结点的父类型,其可以转化为其他的结点类型。
  • TiXmlElement:element结点,即我们平常所使用的,具有属性,tagName的结点。
  • TiXmlComment:注释
  • TiXmlText:文字结点。
  • TiXmlDeclaration:xml的声明(?xml version="1.0" standalone="yes"?>)
  • TiXmlUnknown:任何tinyXml不认的结点都将归结为unknown,在重新写回文件时,按照原样输出。

一般我们的操作仅仅在于,取tagName,获取属性,获取文字,迭代,这里就讲下这些操作。

tagName:对于element来说,可以使用element->Value()或者element->ValueStr();//两者区别仅仅在于返回值不同,后者返回string。

对于Value()函数来说,文档上也解释了,对于不同的结点,返回值不同。

Document: filename of the xml file
Element: name of the element
Comment: the comment text
Unknown: the tag contents
Text: the text string

获取属性:获取属性有多种方式。最简单的是采用const char* Attrubute(const char *),或者采用QueryValueAttribute (const std::string &name, T *outValue) const。还有获取相应类型,如Int,double等的函数。可以自己查看手册。有时候需要遍历属性时,可以这么写:

1 TiXmlAttribute *attr = NULL;
2 attr = element->FirstAttribute();
3 while(attr)
4 {
5 cout << attr->NameTStr() << "=" << attr->ValueStr();
6 attr = attr->Next();
7 }

获取文字:element->GetText();

迭代:

1 TiXmlNode *child = NULL;
2 while(child = parent->IterateChildren(child))
3 {
4 cout << child->ValueStr() << endl;
5 }

总结:

对于TinyXml的介绍大致到这,还有很多细节还没叙述,不过可以看看文档,下的源码包里头就有doc,很方便,讲的也很详细。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: tinyxml2是一个开源的、轻量级的XML解析库。它是对C++标准库的简单封装,用于处理XML文件的读取、解析以及创建和修改XML文件。 tinyxml2库具有以下特点和功能: 1. 易于使用tinyxml2库的API设计简单、易于理解和操作,可以方便地读取和解析XML文件中的数据。 2. 快速且内存占用低:tinyxml2库使用了基于迭代器的解析算法,解析速度快,而且内存占用较小。 3. 跨平台兼容性:tinyxml2库可以在不同的操作系统和编译器上运行,具有良好的跨平台兼容性。 4. 支持Unicode:tinyxml2库支持Unicode编码的XML文件,可以正确地处理各种国际化字符。 5. 支持创建和修改XML文件:tinyxml2库可以方便地创建和修改XML文件,可以添加、删除和修改XML节点及其属性。 6. 错误处理能力强:tinyxml2库提供了丰富的错误处理机制,可以捕获和处理解析XML文件中的错误。 7. 可靠性高:tinyxml2库在解析XML文件时具有良好的鲁棒性,可以处理复杂的XML文件结构和错误格式的XML文件。 总之,tinyxml2是一个功能强大、可靠高效的XML解析库,适用于各种C++项目中需要处理XML文件的场景。无论是读取、解析、创建还是修改XML文件,tinyxml2都提供了简单易用的API,并且具有较好的跨平台兼容性和Unicode支持。 ### 回答2: TinyXML2是一个轻量级的C++库,用于解析和生成XML文档。它是TinyXML库的升级版本,提供了更好的性能和易于使用的API。 TinyXML2具有简单直观的接口,支持XML的基本操作,如加载、解析、访问和修改XML文档。它提供了一些类和函数,可以方便地在代码中处理XML数据。 TinyXML2支持从文件、字符串和内存中加载XML文档。它可以解析XML元素、属性、文本内容和注释,并提供了访问和修改这些数据的接口。用于访问和修改XML数据的API是面向对象的,使得操作XML文档更加方便和直观。 TinyXML2还提供了将XML文档序列化为字符串的功能,以及将XML数据写入到文件中的功能。这使得可以方便地将XML文档保存到文件或其他储存介质中,或者将XML数据通过网络传输。 TinyXML2使用C++语言编写,具有良好的可移植性和跨平台性。它不依赖于任何外部库,只需要包含头文件即可使用。这使得它非常适合用于嵌入式系统或其他资源有限的环境中。 总之,TinyXML2是一个功能强大、易于使用的C++库,用于解析和生成XML文档。它提供了简单直观的API,支持XML的基本操作,同时具有良好的可移植性和跨平台性。无论是在桌面应用程序、嵌入式系统还是其他需要处理XML的项目中,TinyXML2都是一个很好的选择。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值