PDF文件的读写(使用SDK).(三).PoDoFo的简单应用

在免费的PDF SDK中,我选择了PoDoFo,这也是无奈之举。因为我在网上搜索到的众多免费PDF SDK,绝大多数都是功能比较单一的。要么只能显示PDF,要么只能创建PDF。而对PoDoFo的描述是:操纵PDF……OK,那就是它了。

 

按前面所说的操作,编译好PoDoFo,这时候,你会得到好几个文件。不过,你需要注意的,只有两个:PoDoFo.dll和PoDoFo.lib。前者是在运行程序时需要的,而后者是在编译时需要的。当然,如果你按README.HTM所说,先生成sln文件,然后再用VC打开sln文件,则会发现你打开的解决方案中,会包含一大溜的工程。这些工程,除了PoDoFo本身外,还有一些小工具和测试工程。这些东西都是很有用的,是我们在实际开发中很重要的参考。

 

我们在实际开发中的另一个重要的参考,就是PoDoFo自带的说明文档。按照通常的编程惯例,这些文档中,最重要的又属《编程指南》和《类/函数参考手册》。我暂时尚未找到中文版的这些文档。

 

创建一个VC工程,然后参考PoDoFo.sln中的测试工程,设置好工程的各项属性。当然,这里最重要的,仍然是两个设置:1.INCLUDE包含路径,它必须指向PoDoFo.h所在目录以及相关目录;2.LIB目录指向编译好的PoDoFo.lib所在路径,同时在工程的附加依赖库属性必须填上PoDoFo.lib及其相关依赖。

 

在CPP文件中填入代码:include <podofo.h>,然后指示使用名空间PoDoFo:using namespace PoDoFo;

点击编译,测试一下设置是否正确。

 

如果需要在PDF文件中填入点什么东西,那么我们就特别要注意这句话:在哪个PDF文件上的哪一页上的哪个位置写入什么样子的什么内容。

 

1.“哪个PDF文件”。这个问题对于PoDoFo来说,就是PdfDocument类。不过这个类貌似是个抽象类(我不记得自己是否确认过这点,因为我一般都不直接使用它),我们一般使用的是它的两个子类:PdfStreamedDocument类和PdfMemDocument类。前者主要用于创建一个新的PDF文档,而后者主要用于处理现有的PDF文档。这两个类我都研究不深,但我感觉PdfMemDocument类似乎有一个缺陷:它必须要有一个input file和output file,且二者不能同名。这也就意味着,一般来说,你不可以直接对现有的PDF文件进行修改,而需要先读入现有PDF文件,修改完成后再写入另一个PDF文件。这个问题的来源,应该是PDF文件的一般打开方式:它是使用流的方式打开的。使用这种方式打开,最大的优点就是打开的初始速度很快,你需要什么东西,则再临时读入,总体上占用内存比较少。当你写入PDF文档时,你的PDF程序,就相当于一个抽水机,把数据流从一个文件抽(复制)到另一个文件。如果两个文件同名了,则读和写就会发生冲突。

解决这个问题的其中一个办法,就是把要读入的文件,一次性全部读入内存中,然后回写的时候,就不用考虑同名的问题了。

 

2.“哪一页”。这个问题对于PoDoFo来说,就是PdfPage类。这个类对于具体的修改操作来说,只能算是一个过渡。它可以用来指向PdfDocument 的一个页面位置。

 

3.“哪个位置写入什么样子的什么内容”。这个问题,对于PoDoFo来说,都和PdfPainter类有关。但又不是全靠PdfPainter类来操纵。比如,字体设置,一般会去实例化一个PdfFont类。使用PoDoFo来操纵PDF,PdfPainter是一个非常重要的类,其重要程度,我个人感觉甚至要超过PdfDocument类。

操作完成后,不要忘记:painter.FinishPage();

看到这句,可能大家都有些恍然:PDF,还是以页为处理单位。

 

PoDoFo的具体使用,我建议大家还是去参考它的例程和文档资料,这里不多描述。

 

在我的实际使用过程中,碰到了一个很有意思的问题:中文显示。

据我了解,最初的PDF SDK,或多或少都有多国语言显示的问题。从DOS时代过来的人,当然不会觉得惊讶,因为在N年前DOS下显示中文就是一个很大的问题。现在使用UNICODE编码,似乎一切问题都解决了,可历史的惯性,从来不是那么容易就消除的。

 

我用的算是WIN32版本的PoDoFo吧,Font的编码默认是WINDOWS ANSI,显示英文是没什么问题的,但写入中文,则会显示乱码。

其实我知道,这个问题和使用的字体名称,字体编码都有关系,但我没在PoDoFo的手册上找到问题的解决方法(这个可能和我看手册不认真有关系),只是在例程上找到一个CreationTest工程。这个工程是写入日文之类的东西的(由于我系统上没有安装其它国家的文字,看到的都是乱码)。CreationTest这个工程中的东西似乎稍稍有些复杂,幸好PoDoFo的开发工程师一周后答复了我的疑问,给出了下面代码:

PdfIdentityEncoding encoding(0, 0xffff, false);

PdfFont* pUnicFont = pdfStream.CreateFont( "SimHei", &encoding, false);

 

总体来说,PoDoFo还是很优秀的,但是目前问题也比较多。使用起来比较复杂,就是一个很严重的问题。部分演示代码也貌似也得有问题,比如我拿到的0.9.0版中关于PDF 水印的代码,对我来说,就没有任何价值。

 

衷心希望PoDoFo能做得更好!只是目前,我还是考虑换个PDF SDK吧……

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 20
    评论
pdf.js 是 Mozilla 开源的一个 JavaScript 库,用于在网页中显示 PDF 文件。它可以将 PDF 文件转换成 HTML5 Canvas 和 SVG 格式,通过浏览器的绘图功能进行渲染,实现了纯客户端的 PDF 阅读器。 使用 pdf.js 进行 PDF 文件预览,需要先在页面中引入 pdf.js 和 pdf.worker.js 两个 JavaScript 文件,然后使用以下代码创建一个 PDF 预览器: ```html <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>PDF.js example</title> <script src="pdf.js"></script> <script src="pdf.worker.js"></script> </head> <body> <canvas id="pdf-canvas"></canvas> <script> // PDF.js 预览器 var canvas = document.getElementById('pdf-canvas'); var url = 'example.pdf'; // 加载 PDF 文件 PDFJS.getDocument(url).then(function (pdf) { // 获取第一页 pdf.getPage(1).then(function (page) { // 设置缩放比例 var scale = 1.5; // 获取页面宽度 var viewport = page.getViewport(scale); // 设置 Canvas 大小 canvas.width = viewport.width; canvas.height = viewport.height; // 渲染页面 var ctx = canvas.getContext('2d'); var renderContext = { canvasContext: ctx, viewport: viewport }; page.render(renderContext); }); }); </script> </body> </html> ``` 上述代码中,使用 `PDFJS.getDocument(url)` 方法加载 PDF 文件,并通过 `pdf.getPage(1)` 方法获取第一页,然后根据缩放比例和页面宽度计算 Canvas 大小,并使用 `page.render(renderContext)` 方法渲染页面。 需要注意的是,pdf.worker.js 文件的路径需要与 pdf.js 文件的路径相同,否则会出现无法加载 worker 的问题。另外,pdf.js 依赖于 Promise 和 TypedArray 等 Web API,需要在较新版本的浏览器中使用

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 20
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值