PDF文件的读写（使用SDK）.（三）.PoDoFo的简单应用

最新推荐文章于 2024-07-19 20:55:24 发布

super_admi

最新推荐文章于 2024-07-19 20:55:24 发布

阅读量1.2w

点赞数

分类专栏：编程学习工作相关编程思考文章标签：文档 encoding dos 测试 include 编程

本文链接：https://blog.csdn.net/super_admi/article/details/6384724

版权

编程学习同时被 3 个专栏收录

24 篇文章 2 订阅

订阅专栏

工作相关

13 篇文章 0 订阅

订阅专栏

编程思考

6 篇文章 1 订阅

订阅专栏

在免费的PDF SDK中，我选择了PoDoFo，这也是无奈之举。因为我在网上搜索到的众多免费PDF SDK，绝大多数都是功能比较单一的。要么只能显示PDF，要么只能创建PDF。而对PoDoFo的描述是：操纵PDF……OK，那就是它了。

按前面所说的操作，编译好PoDoFo，这时候，你会得到好几个文件。不过，你需要注意的，只有两个：PoDoFo.dll和PoDoFo.lib。前者是在运行程序时需要的，而后者是在编译时需要的。当然，如果你按README.HTM所说，先生成sln文件，然后再用VC打开sln文件，则会发现你打开的解决方案中，会包含一大溜的工程。这些工程，除了PoDoFo本身外，还有一些小工具和测试工程。这些东西都是很有用的，是我们在实际开发中很重要的参考。

我们在实际开发中的另一个重要的参考，就是PoDoFo自带的说明文档。按照通常的编程惯例，这些文档中，最重要的又属《编程指南》和《类/函数参考手册》。我暂时尚未找到中文版的这些文档。

创建一个VC工程，然后参考PoDoFo.sln中的测试工程，设置好工程的各项属性。当然，这里最重要的，仍然是两个设置：1.INCLUDE包含路径，它必须指向PoDoFo.h所在目录以及相关目录；2.LIB目录指向编译好的PoDoFo.lib所在路径，同时在工程的附加依赖库属性必须填上PoDoFo.lib及其相关依赖。

在CPP文件中填入代码：include <podofo.h>，然后指示使用名空间PoDoFo：using namespace PoDoFo;

点击编译，测试一下设置是否正确。

如果需要在PDF文件中填入点什么东西，那么我们就特别要注意这句话：在哪个PDF文件上的哪一页上的哪个位置写入什么样子的什么内容。

1.“哪个PDF文件”。这个问题对于PoDoFo来说，就是PdfDocument类。不过这个类貌似是个抽象类（我不记得自己是否确认过这点，因为我一般都不直接使用它），我们一般使用的是它的两个子类：PdfStreamedDocument类和PdfMemDocument类。前者主要用于创建一个新的PDF文档，而后者主要用于处理现有的PDF文档。这两个类我都研究不深，但我感觉PdfMemDocument类似乎有一个缺陷：它必须要有一个input file和output file，且二者不能同名。这也就意味着，一般来说，你不可以直接对现有的PDF文件进行修改，而需要先读入现有PDF文件，修改完成后再写入另一个PDF文件。这个问题的来源，应该是PDF文件的一般打开方式：它是使用流的方式打开的。使用这种方式打开，最大的优点就是打开的初始速度很快，你需要什么东西，则再临时读入，总体上占用内存比较少。当你写入PDF文档时，你的PDF程序，就相当于一个抽水机，把数据流从一个文件抽（复制）到另一个文件。如果两个文件同名了，则读和写就会发生冲突。

解决这个问题的其中一个办法，就是把要读入的文件，一次性全部读入内存中，然后回写的时候，就不用考虑同名的问题了。

2.“哪一页”。这个问题对于PoDoFo来说，就是PdfPage类。这个类对于具体的修改操作来说，只能算是一个过渡。它可以用来指向PdfDocument 的一个页面位置。

3.“哪个位置写入什么样子的什么内容”。这个问题，对于PoDoFo来说，都和PdfPainter类有关。但又不是全靠PdfPainter类来操纵。比如，字体设置，一般会去实例化一个PdfFont类。使用PoDoFo来操纵PDF，PdfPainter是一个非常重要的类，其重要程度，我个人感觉甚至要超过PdfDocument类。

操作完成后，不要忘记：painter.FinishPage();

看到这句，可能大家都有些恍然：PDF，还是以页为处理单位。

PoDoFo的具体使用，我建议大家还是去参考它的例程和文档资料，这里不多描述。

在我的实际使用过程中，碰到了一个很有意思的问题：中文显示。

据我了解，最初的PDF SDK，或多或少都有多国语言显示的问题。从DOS时代过来的人，当然不会觉得惊讶，因为在N年前DOS下显示中文就是一个很大的问题。现在使用UNICODE编码，似乎一切问题都解决了，可历史的惯性，从来不是那么容易就消除的。

我用的算是WIN32版本的PoDoFo吧，Font的编码默认是WINDOWS ANSI，显示英文是没什么问题的，但写入中文，则会显示乱码。

其实我知道，这个问题和使用的字体名称，字体编码都有关系，但我没在PoDoFo的手册上找到问题的解决方法（这个可能和我看手册不认真有关系），只是在例程上找到一个CreationTest工程。这个工程是写入日文之类的东西的（由于我系统上没有安装其它国家的文字，看到的都是乱码）。CreationTest这个工程中的东西似乎稍稍有些复杂，幸好PoDoFo的开发工程师一周后答复了我的疑问，给出了下面代码：

PdfIdentityEncoding encoding(0, 0xffff, false);

PdfFont* pUnicFont = pdfStream.CreateFont( "SimHei", &encoding, false);

总体来说，PoDoFo还是很优秀的，但是目前问题也比较多。使用起来比较复杂，就是一个很严重的问题。部分演示代码也貌似也得有问题，比如我拿到的0.9.0版中关于PDF 水印的代码，对我来说，就没有任何价值。

衷心希望PoDoFo能做得更好！只是目前，我还是考虑换个PDF SDK吧……