![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
PDF 标准学习
文章平均质量分 67
以理论为准绳,以实例为抓手,深入理解pdf数据文档结构
fxbjye
c++软件开发者
展开
-
PDF之文档结构
PDF 文档可被视为 PDF 文件正文部分所包含的对象层次结构。在层次结构的根部,是文档目录字典,可通过 PDF 文件的尾注中的 Root 条目定位。目录包含对定义文档内容、大纲、文章线索、已命名目标和其他属性的其他对象的引用。 ...原创 2021-04-08 17:28:37 · 1631 阅读 · 0 评论 -
PDF之文件结构
PDF文件应有以下四个元素构成:1)一行文件头,标识文件所符合的PDF规范版本。2)正文,包含了组成文件中所含文档的对象。3)一个交叉引用表,包含关于文件中间接对象的信息。4)尾注提供交叉引用表和文件正文某些特殊对象的位置。1,文件头,PDF 文件的第一行应是一个文件头,包含 5 个字符 %PDF- ,后跟 1.N 形式的版本号,其中 N 是 0 到7 之间的数字。如果 PDF 文件包含二进制数据,大多数文件都是这样,那么文件头行之后应紧跟一个注释行,其中包含至少 4 个二进制字符,原创 2021-04-07 15:56:17 · 821 阅读 · 0 评论 -
PDF之过滤器简介
过滤器,在读取流数据时的一个选项是用过滤器对它进行解码,生成原始的未编码数据。流的一个或多个过滤器应由流字典中的Filter条目指定,过滤器可以级联,通过依次执行两次或者多次编码转换形成传递流的管道。示例:/Filter [/ASCII85Decode /LAWDecode]。标准过滤器包括:ASCIIHexDecode,ASCII85Decode,LZWDecode,FlateDecode,RunLengthDecode,CCITTFaxDecode,JBIG2Decode,DCTDecode,JPX原创 2021-04-07 10:10:31 · 1483 阅读 · 0 评论 -
PDF之基本对象类型
PDF包含8种基本的对象类型:布尔值,整型和实数,字符串,名称,数组,字典,流,null对象。1,布尔对象,布尔对象表示真和假的逻辑值。显示为关键字true和false。2,数字对象,PDF提供了两种类型的数字对象:整型和实数。整数对象表示数学上的整数,书写为一个或多个十进制数,可选择在前面添加一个符号,示例:123,4123,+19,-98,0。实数对象表示数学上的实数,书写为一个或多个带有可选的正负号,以及一个前导,结尾或嵌入的句点(小数点)的十进制数,示例:34.5,-3.63,+123.6,原创 2021-04-06 17:35:00 · 1568 阅读 · 1 评论