当您开发处理PDF文件的软件时,您通常需要能够深入研究文件并查看内部结构。PDF文件格式是一种复杂的ascii/二进制格式,您不能在编辑器中查看它。您需要一个工具来理解文件结构并显示原始数据。
JPedal Viewer
我们的JPedal Viewer现在有一个检查PDF文件的模式,试用版和完整版都支持(因此您无需付费即可使用它)。
它还有一个独特的功能,允许您查看和调试PDF内容流。
您可以从支持页面了解更多信息并下载软件。
RUPS
RUPS是iText开发团队的免费工具,允许您打开PDF文件并查看实际对象数据。它有一个非常好的GUI前端,允许您深入到对象中。如果您正在开发使用PDF文件的软件(或需要了解PDF文件中的内容),这将为您节省大量时间!
您可以从RUPS主页了解更多信息并下载软件
以下是一个PDF文件的示例:
这就是在RUPS里显示的样子!我正在查看XObject,它是页面上的主要图像。如您所见,有各种各样的选项卡,允许您以不同的方式查看PDF对象。您可以在右下角看到图像,在左侧看到所有字典信息。
在这种情况下,您可以直接在文件中访问此数据,但它会不那么清晰,并且您看不到文件结构。
PDFXplorer
PDFXplorer是O2 Solutions的另一个免费工具。这是一个小型的、仅限Windows的免费软件应用程序,允许您探索PDF的内部结构,因为它被布置在树上。
将以下的:
(用文本编辑器打开PDF时看到的)
变成这样的:
(PDFXplorer里看到的)
它在整齐的表格中列出了每个对象属性,有一个不错的的导航选项卡,可让您轻松在PDF中移动,还允许您在PDF文件中查看和保存流和文本数据。
当您想知道PDF中存在哪些嵌入式JavaScript以及它与什么对象相关联时,或者从PDF中提取某些类型的图像时,它非常有用。
这些数据有什么用?
如果您想更好地了解这些数据以及PDF文件中的内容,您会发现我们关于学习PDF的其他博客文章很有帮助。