双层PDF的制作——使用PDF4NET 3.3.6 实现
所谓双层PDF就是每一页都包含两层,上层是图像,下层是该图像对应的文字。既可以像图像一样浏览,又可以像文字一样复制、查找。这样兼顾了阅读的效果和使用方便性。
在Google里面搜索,大多数双层PDF制作方法都是使用OCR技术实现的。这些方法的制作前提是,原始的数据只是图片,不存在对应的文字版。这不在本文的讨论范围内,本文主要探讨如何对已经拥有文字版的word或者其他文件的情况下,制作双层PDF。具体来说就是存在一个排版好的word文件,将这个word文件制作成一个双层PDF。
闲话少说,具体的制作过程如下
1、将文字版的文件(word)转换为以文本方式存储的PDF文件,这个使用PDFCreator采用虚拟打印的方式即可实现。这里暂定该文件的名称为"w.pdf"。
2、将创建的的文本方式的存储的PDF文件(w.pdf),转换为以图片方式存储的PDF文件。这个可以用PDFCreator的虚拟打印机,先打印成TIFF格式的文件,再将这个TIFF文件虚拟打印成一个PDF的方式实现,这里暂定该图片方式的PDF文件名为“p.pdf”。
3、将文字方式存储的PDF文件和图片方式存储的PDF文件采用按页合并的方式生成一个新的PDF文件,其中图片方式的PDF在上层。这个采用PDF4NET 3.3.6 进行二次开发的方式实现。以下代码为visual studio 2005环境下,使用C#编写。
(1)将O2S.Components.PDF4NET.dll添加到工程的