libxml读取xml文件的其他方法

最新推荐文章于 2024-03-09 14:44:31 发布

nosmatch

最新推荐文章于 2024-03-09 14:44:31 发布

阅读量3.9k

点赞数

在前面一篇文章我提到了一种分析文档的方法，即调用xmlParseFile函数。当我看了libxml官网上的code examples之后，我发现libxml还提供了更加精准的分析方式。

 1 调用xmlReadFile函数
 xmlReadFile函数接收三个参数，第一个参数是文件名，第二个参数是编码类型，第三个参数是分析时的选项。由于提供了更多的参数，所以这个函数能更精确的处理文件。这个函数返回一个xmlDocPtr，得到这个指针后我们可以对各个节点进行操作了。
 
[cpp]view plaincopyprint? 
    
 xmlDocPtr doc = NULL;  
 doc = xmlReadFile(docname, NULL, XML_PARSE_DTDVALID);  

 2 使用xmlParseCtxtPtr解析文件 
  
 libxml提供了这样一个结构体xmlParserCtxt，这个结构体可以深入控制解析的工程，先看看他是如何工作的。
 
[cpp]view plaincopyprint? 
    
 xmlParserCtxtPtr ctxt = NULL;  
 xmlDocPtr doc = NULL;  
   
 ctxt = xmlNewParserCtxt();  
 doc = xmlCtxtReadFile(ctxt, docnamen,NULL, 0);  

 不要忘了最后释放ctxt。 
  
 使用ctxt的一个操作就是分块处理文件，即读进文件的一部分，边读边分析。
 
[cpp]view plaincopyprint? 
    
 xmlParserCtxtPtr ctxt  = NULL;  
 xmlDocPtr doc = NULL;  
 static char chunk[1024];  
 int num = 0;  
 FILE* fd = NULL;  
   
 fd = fopen(docname, "rb");  
 if(NULL == fd) {  
     fprintf(stderr, "open error!\n");  
     exit(1);  
 }  
   
 num = fread(chunk, 1, 1024, fd);  
   
 if(num <= 0) {  
     fprintf(stderr, "read error!\n");  
     fclose(fd);  
     exit(2);  
 }  
   
 ctxt = xmlCreatePushParserCtxt(NULL, NULL, chunk, num, docname);  
   
 if(NULL == ctxt) {  
     fprintf(stderr, "cannot create ctxt\n");  
     fclose(fd);  
     exit(3);  
 }  
   
 while((num = fread(chunk,1,1024,fd)) >0) {  
     xmlParseChunk(ctxt, chunk, num, 0);  
 }  
 xmlParseChunk(ctxt, chunk,0,1);  
   
 doc = ctxt->myDoc;  
 num = ctxt->wellFormed;  
   
 xmlFreeParserCtxt(ctxt);  
   
 if(0 == num) {  
     fprintf(stderr, "fail to parse!\n");  
     fclose(fd);  
     exit(4);  
 }  
 // handle doc  
   
 xmlFreeDoc(doc);  
 fclose(fd);  

nosmatch

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
libxml读取xml文件的其他方法

在前面一篇文章我提到了一种分析文档的方法，即调用xmlParseFile函数。当我看了libxml官网上的code examples之后，我发现libxml还提供了更加精准的分析方式。1 调用xmlReadFile函数xmlReadFile函数接收三个参数，第一个参数是文件名，第二个参数是编码类型，第三个参数是分析时的选项。由于提供了更多的参数，所以这个函数能更精确的处理文件。
复制链接

扫一扫