Linux下libxml库编程(-)

本文档主要介绍XML的基本知识及如何利用libxml来操作xml文件。
XML是eXtensible Markup Language的缩写,它是一种可扩展性标识语言, 能够让你自己创造标识,标识你所表示的内容。DOM全称是Document Object Model(文档对象模型),定义了一组与平台和语言无关的接口,以便程序和脚本能够动态访问和修改XML文档内容、结构及样式。XML创建了标识,而DOM的作用就是告诉程序如何操作和显示这些标识。
XML将数据组织成为一棵树,DOM通过解析XML文档,为XML文档在逻辑上建立一个树模型,树的节点是一个个的对象。这样通过操作这棵树和这些对象就可以完成对XML文档的操作,为处理文档的所有方面提供了一个完美的概念性框架。
XML 中共有12种节点类型,其中最常见的节点类型有5种:
元素:元素是 XML 的基本组成单元。,描述XML的基本信息。
属性:属性节点包含关于元素节点的信息,通常包含在元素里面,描述元素的属性。
文本:包含许多文本信息或者只是空白。
文档:文档节点是整个文档中所有其它节点的父节点。
注释:注释是对相关的信息进行描述、注释。
需求安装包:libxml2 和libxm2-devel,其中libxml主要包括.so文件,libxml2-devel 包括开发文档和所有的.h文件。可用rpm –ql 命令查看,rpm –qd可查看文档信息。
在libXml中用xmlCha 替代char,XML使用UTF-8编码的一字节字符串。如果你的数据使用其它编码,它必须被转换到UTF-8才能使用libxml的函数。
如同标准c中的char类型一样,xmlChar也有动态内存分配、字符串操作等相关函数。例如xmlMalloc是动态分配内存的函数;xmlFree是配套的释放内存函数;xmlStrcmp是字符串比较函数等等。基本上xmlChar字符串相关函数都在xmlstring.h中定义;而动态内存分配函数在xmlmemory.h中定义。
另外要注意,因为总是要在xmlChar*和char*之间进行类型转换,所以定义了一个宏BAD_CAST,其定义如下:xmlstring.h

 

#define BAD_CAST (xmlChar *)

 

原则上来说,unsigned char和char之间进行强制类型转换是没有问题的。
XmlDoc: 代表DOM结构中的文档类型。包含由解析文档建立的树结构,xmlDocPtr是指向这个结构的指针。
xmlNode:代表DOM结构中的除文档类型类型外的其它节点类型。包含单一结点的结构,xmlNodePtr是指向这个结构的指针,它被用于遍历文档树。节点应该是xml中最重要的元素了,xmlNode代表了xml文档中的一个节点,实现为一个struct,内容很丰富:tree.h

 

typedef struct _xmlNode xmlNode;
typedef xmlNode *xmlNodePtr;
struct _xmlNode {
    void           *_private;
     xmlElementType   type;  
    const xmlChar   *name;     
    struct _xmlNode *children;
    struct _xmlNode *last;  
    struct _xmlNode *parent;
    struct _xmlNode *next;  
    struct _xmlNode *prev;  
    struct _xmlDoc *doc;
   
    xmlNs           *ns;       
    xmlChar         *content;  
    struct _xmlAttr *properties;
    xmlNs           *nsDef;    
    void            *psvi;
    unsigned short   line;  
    unsigned short   extra;
};

 

以看到,节点之间是以链表和树两种方式同时组织起来的,next和prev指针可以组成链表,而parent和children可以组织为树。所有节点都是文档XmlDoc节点的直接或间接子节点。同时还有以下重要元素:
l节点中的文字内容:content
l   节点所属文档:doc
l   节点名字:name
l   节点的namespacens
l   节点属性列表:properties
Xml文档的操作其根本原理就是在节点之间移动、查询节点的各项信息,并进行增加、删除、修改的操作。xmlDocSetRootElement函数可以将一个节点设置为某个文档的根节点,这是将文档与节点连接起来的重要手段,当有了根结点以后,所有子节点就可以依次连接上根节点,从而组织成为一个xml树。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值