元素:元素是 XML 的基本组成单元。,描述XML的基本信息。
属性:属性节点包含关于元素节点的信息,通常包含在元素里面,描述元素的属性。
文本:包含许多文本信息或者只是空白。
文档:文档节点是整个文档中所有其它节点的父节点。
注释:注释是对相关的信息进行描述、注释。
#define BAD_CAST (xmlChar *)
|
typedef struct _xmlNode xmlNode;
typedef xmlNode *xmlNodePtr;
struct _xmlNode {
void *_private;/* application data */
xmlElementType type; /* type number, must be second ! */
const xmlChar *name; /* the name of the node, or the entity */
struct _xmlNode *children; /* parent->childs link */
struct _xmlNode *last; /* last child link */
struct _xmlNode *parent;/* child->parent link */
struct _xmlNode *next; /* next sibling link */
struct _xmlNode *prev; /* previous sibling link */
struct _xmlDoc *doc;/* the containing document */
/* End of common part */
xmlNs *ns; /* pointer to the associated namespace */
xmlChar *content; /* the content */
struct _xmlAttr *properties;/* properties list */
xmlNs *nsDef; /* namespace definitions on this node */
void *psvi;/* for type/PSVI informations */
unsigned short line; /* line number */
unsigned short extra; /* extra data for XPath/XSLT */
};
|
3.3 重要操作
3.3.1 创建 XML 文档
创建一个 xml 文档流程如下:
l 用 xmlNewDoc 函数创建一个文档指针 doc ;
l 用 xmlNewNode 函数创建一个节点指针 root_node ;
l 用 xmlDocSetRootElement 将 root_node 设置为 doc 的根结点;
l 给 root_node 添加一系列的子节点,并设置子节点的内容和属性;
l 用 xmlSaveFile 将 xml 文档存入文件;
l 用 xmlFreeDoc 函数关闭文档指针,并清除本文档中所有节点动态申请的内存
示例代码:
#include <stdio.h> #include <libxml/parser.h> #include <libxml/tree.h> int main(int argc , char **argv) { xmlDocPtr pdoc = NULL; xmlNodePtr proot_node = NULL ,pnode = NULL , pnode1 = NULL; // 创造一个新文档并设置要 root 节点 // 在 XML 文档中有且只有一个 root 节点 pdoc = xmlNewDoc( BAD_CAST "1.0"); proot_node = xmlNewNode(NULL , BAD_CAST "plist"); xmlNewProp(proot_node , BAD_CAST "version" , BAD_CAST "1.0"); xmlDocSetRootElement(pdoc , proot_node);
pnode = xmlNewNode( NULL , BAD_CAST "dict" ); // 创造 root 节点的子节点 xmlNewChild(pnode , NULL , BAD_CAST "key" , BAD_CAST "info");
pnode1 = xmlNewNode( NULL , BAD_CAST "dict" );
// 保存文档 xmlSaveFormatFileEnc(argc > 1 ? argv[1] : "-", pdoc, "UTF-8", 1); // 释放文档指针 xmlFreeDoc(pdoc); xmlCleanupParser(); xmlMemoryDump(); //debug memory for regression tests return(0); } |
涉及相关函数:
xmlNewDoc , xmlNewNode , xmlDocSetRootElement , xmlSaveFile , xmlFreeDoc 。
3.3.2 解释文档
解析一个 xml 文档,从中取出想要的信息,例如节点中包含的文字,或者某个节点的属性,其流程如下:
l 用 xmlReadFile 函数读出一个文档指针 doc ;
l 用 xmlDocGetRootElement 函数得到根节点 curNode ;
l curNode->xmlChildrenNode 就是根节点的子节点集合;
l 轮询子节点集合,找到所需的节点,用 xmlNodeGetContent 取出其内容;
l 用 xmlHasProp 查找含有某个属性的节点;
l 取出该节点的属性集合,用 xmlGetProp 取出其属性值;
l 用 xmlFreeDoc 函数关闭文档指针,并清除本文档中所有节点动态申请的内存。
注意:节点列表的指针依然是 xmlNodePtr ,属性列表的指针也是 xmlAttrPtr ,并没有 xmlNodeList 或者 xmlAttrList 这样的类型。看作列表的时候使用它们的 next 和 prev 链表指针来进行轮询。只有在 Xpath 中有 xmlNodeSet 这种类型,其使用方法前面已经介绍了 。
示例代码:
int main(int argc , char **argv) { xmlDocPtr pdoc = NULL; xmlNodePtr proot=NULL , pcurnode = NULL; char *psfilename; if (argc < 1) { printf("error: Usage: %s filename/n" , argv[0]); exit(1); } psfilename = argv[1]; pdoc = xmlReadFile(psfilename ,"UTF-8",XML_PARSE_RECOVER); if(NULL == pdoc) { printf("error: open file %s" , psfilename); exit(1); } pcurnode = xmlDocGetRootElement(pdoc);
if(NULL == pcurnode) { printf("error: empty document %s" , psfilename); exit(1); } if(xmlStrcmp(pcurnode->name , BAD_CAST "plist") != 0) { printf("error document " ); exit(1); } if(xmlHasProp(pcurnode ,BAD_CAST "version")) { xmlChar *szAttr = xmlGetProp(pcurnode, BAD_CAST "version"); printf("get version : %s /n" , szAttr); } xmlFreeDoc(pdoc); xmlCleanupParser(); return 0; } |
涉及函数:
xmlParseFile , xmlReadFile , xmlDocGetRootElement , xmlHasProp , xmlGetProp 。其中 xmlParseFile 和 xmlReadFile 都具备打开 XML 文件的功能, xmlParseFile 函数以默认方式读入一个 UTF-8 格式的文档,并返回文档指针。 xmlReadFile 函数读入一个带有某种编码的 xml 文档,并返回文档指针。
3.3.3 修改 XML
有了上面的基础,修改 xml 文档的内容就很简单了。首先打开一个已经存在的 xml 文档,顺着根结点找到需要添加、删除、修改的地方,调用相应的 xml 函数对节点进行增、删、改操作。
示例代码:
#include <libxml/parser.h>
#include <iostream.h>
int main(int argc, char* argv[])
{
xmlDocPtr doc; // 定义解析文档指针
xmlNodePtr curNode; // 定义结点指针 ( 你需要它为了在各个结点间移动 )
char *szDocName;
if (argc <= 1)
{
printf("Usage: %s docname/n", argv[0]);
return(0);
}
szDocName = argv[1];
doc = xmlReadFile(szDocName,"GB2312",XML_PARSE_RECOVER); // 解析文件
if (NULL == doc)
{
fprintf(stderr,"Document not parsed successfully. /n");
return -1;
}
curNode = xmlDocGetRootElement(doc);
/* 检查确认当前文档中包含内容 */
if (NULL == curNode)
{
fprintf(stderr,"empty document/n");
xmlFreeDoc(doc);
return -1;
}
curNode = curNode->children;
while (NULL != curNode)
{
// 删除 newNode1
if (!xmlStrcmp(curNode->name, BAD_CAST "newNode1"))
{
xmlNodePtr tempNode;
tempNode = curNode->next;
xmlUnlinkNode(curNode);
xmlFreeNode(curNode);
curNode = tempNode;
continue;
}
// 修改 node2 的属性值
if (!xmlStrcmp(curNode->name, BAD_CAST "node2"))
{
xmlSetProp(curNode,BAD_CAST "attribute", BAD_CAST "no");
}
// 修改 newNode2 的内容
if (!xmlStrcmp(curNode->name, BAD_CAST "newNode2"))
{
xmlNodeSetContent(curNode, BAD_CAST "content changed");
}
// 增加一个属性
if (!xmlStrcmp(curNode->name, BAD_CAST "newNode3"))
{
xmlNewProp(curNode, BAD_CAST "newAttr", BAD_CAST "YES");
}
// 增加一个子节点
if (!xmlStrcmp(curNode->name, BAD_CAST "son"))
{
xmlNewTextChild(curNode, NULL, BAD_CAST "newGrandSon", BAD_CAST "new content");
}
curNode = curNode->next;
<font face="T