TinyXML解析word图片

本文介绍如何通过TinyXML库解析Word XML文件,提取其中的图片数据。首先,解释了Word中图片数据在XML文件中的表示形式,即base64编码的二进制数据。接着,讨论了TinyXML的简单介绍和类结构,强调了TinyXmlDocument、TinyXmlNode、TinyXMLElement和TiXmlText类的作用。然后,概述了TinyXML解析XML文档的递归过程,并给出一个实例以加深理解。最后,提供了代码示例,展示如何利用TinyXML解析InlineShape对象来获取Word中的图片数据。
摘要由CSDN通过智能技术生成


       如何将word中的图片数据获取出来,如果是通过word的接口来获取,这个暂时还没有找到,只能采用曲线救国了,通过对word的xml文档做解析,来获取word的图片数据。

你可以将word另存为xml文件以查看word中的图片数据,该数据是图片的二进制数据经由base64编码的。如下图1所示:

图1 word中图片数据在xml中的形式

        现在是通过另存为xml文件的形式,要通过程序获取关键还得看word有无提供获取xml数据的接口,还好word提供了这样的接口,这样一来,解析word的图片数据就容易多了。

接下来主要就是解析xml的工作了。网上有很多开源的xml解析器(如TinyXML,Xerces等)。在这里我使用的是tinyxml,使用它主要是因为它相对其他解析器来说,要小一些,使用起来也灵活一点,最重要的一点是入手比较快。

(TinyXML下载链接:http://sourceforge.net/projects/tinyxml/)

       在这里在对xml的格式做一个简单的介绍吧!

什么是XML?

XML 指可扩展标记语言(EXtensible Markup Language)

XML 是一种标记语言,很类似 HTML

XML 的设计宗旨是传输数据,而非显示数据

XML 标签没有被预定义。您需要自行定义标签。

XML 被设计为具有自我描述性。

XML 是 W3C 的推荐标准

一个XML文档实例

1 <?xmlversion="1.0"?>

2 <note>

3     <to>Tove</to>

4     <from>Jani</from>

5     <heading>Rem
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值