怎么解析linux的xml文件内容,XML文件解析器TXml

前几天看了开源的XML文件解析器TinyXml,它是怎么实现解析的没怎么看懂,于是决定自己实现一个,反正最近不忙。先命名为TXml。现在完成了解析和查询功能,全部代码加起来不到1000行,将会继续完善它。源码必共享

先简单说一下我的思路:

1:读取XML文件信息,并存入一个字符数组中;

2:遍历数组,将数组解析成一棵树;

3:以路径的方式查询和按属性查询;

这个解析器最麻烦的地方就在怎么将字符数组解析成一颗树。我们先看一下一个简单XML文件,他包括文件头、节点、节点名称及节点值、属性名称及属性值,子节点、父节点、注释等。

<?xml version="1.0" encoding="utf-8"?>89757

简单介绍一下解析的实现,不太好说清楚,看代码可能更容易理解一些。递归实现,每次都从一个节点开始解析,就是从字符“”结束,字符后一个字符如果不是

69c5a8ac3fa60e0848d784a6dd461da6.pngconst char* TXmlParser::ParseContent(const char* p,XmlNode*baseNode){if(p==NULL || !*p)returnNULL;if(*p=='') { p++; }++p=SkipWhiteSpace(p); ParseContent(p,baseNode->parent);//新节点 }else{ //节点属性 stringname;while(p!=NULL && *p && *p!='>' && *p!=' ' && *p!='/') { name.push_back(*p++); } XmlNode* node=newXmlNode(name,baseNode); baseNode->AppendNode(node);if(*p=='>') {++p=SkipWhiteSpace(p); ParseContent(p,node);//新节点 }else{ p=GetAttr(p,node);if(*p=='/') {while(p!=NULL && *p && *p!='

69c5a8ac3fa60e0848d784a6dd461da6.png

按路径的方式查询。利用两个数组实现,假设这两个数组分别为A,B;第一次查询将结果存入数组A,将A作为数据源,将查询结果存入B,清除A中的数据,将B作为数据源,将查询结果存入A,反复进行,最后A,B中有一个就是查询结果。当然也可以用递归实现,我们都知道递归太深容易爆线程栈,且性能低。

按属性查询。同样没有用递归实现,有个经常出现的面试题:按层序打印一个棵树。那么这里也是按层序查找,就是利用一个队列,按根节点、根节点的直接子节点进栈,一个个匹配,不匹配就出队列。

69c5a8ac3fa60e0848d784a6dd461da6.png//根据属性查询--利用队列按层序查询XmlNode* XmlNode::SelectSingleNodeByAttr(const string& attrName,const string& attrValue,XmlNode*node){if(node==NULL)returnNULL;if(node->attribute!=NULL && (*node->attribute)[attrName]==attrValue) {returnnode; } queuelist;for(int i=node->ChildCount()-1;i>=0;i--) { list.push((*node->childNodes)[i]); }while(list.size()>0) { XmlNode* tmpNode=list.front();if(tmpNode->attribute!=NULL && (*tmpNode->attribute)[attrName]==attrValue) {returntmpNode; }for(int i=tmpNode->ChildCount()-1;i>=0;i--) { list.push((*tmpNode->childNodes)[i]); } list.pop(); }returnNULL;}

69c5a8ac3fa60e0848d784a6dd461da6.png

看了按属性查找,我们就很容易知道,C#中ConfigurationManager读取配置文件的大致实现,因为配置文件很简单,就是一个节点下面有多个节点,完全可以这样实现,根节点基本可以无视,直接就是一个字典,KEY存key的值,VALUE存value的值,查找的时间复杂度就是O(1)。

简单测试:

69c5a8ac3fa60e0848d784a6dd461da6.png#include "XmlDocument.h" intmain(){ { XmlDocument doc; doc.Load("test.txt"); cout<vect; doc.SelectNodes("students/student/courses/course",vect); XmlNode* node=doc.SelectSingleNode("students/Student/courses/course/Course");if(node!=NULL) { node->ShowXML(*node); cout<Name().c_str()<ShowAttr() ; cout<Value().c_str()<ChildCount()<begin();while(iter!=node->end()) { cout<Name().c_str() <Value().c_str() <ShowXML(*node2); } } system("pause");return 0;}

69c5a8ac3fa60e0848d784a6dd461da6.png

运行结果如下:

14212021%E5%B9%B404%E6%9C%8828%E6%97%A5132021%E5%B9%B404%E6%9C%8828%E6%97%A515392021%E5%B9%B404%E6%9C%8828%E6%97%A52da234d26f4c758d2a7d5cfe3e9c61.jpg

14212021%E5%B9%B404%E6%9C%8828%E6%97%A5132021%E5%B9%B404%E6%9C%8828%E6%97%A515392021%E5%B9%B404%E6%9C%8828%E6%97%A5b7f96691f754aa1b296a1c99044d68e.jpg

未完...待续...功能将会更加丰富,我们都值得期待!

本文转自啊汉博客园博客,原文链接:http://www.cnblogs.com/hlxs/archive/2021年04月28日/3014657.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值