PDF格式分析(四)文档结构概要

本章将对PDF文档结构进行一个简单的描述,好让大家有个简单的认识。
标准的PDF文档一般包括四个部分:
文件头:用来存储PDF版本
文件体:用来存储间接对象,这是构成PDF比重最大的内容
交叉索引表:用来保存各个间接对象在文件中的起始地址
trailer:用来存储交叉索引表的起始位置,根对象(Root),加密对象(Encrypt),文档信息对象(Info)等
pdf文件结构

PDF是一个大的对象集合,有个根对象(Root),该对象中保存着PDF的很多基本信息,并通过间接引用,辐射到所有的间接对象。
根对象下一层就是Pages对象,该对象保存着所有的页对象信息,默认页面的大小等等。
下一层是Page对象,该对象中包含页的各种属性,包括页面的大小(MediaBox,Cropbox等),图片信息,文本信息,字体信息等
完整的文档结构如下图:
这里写图片描述

  • 3
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

秋风之刀

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值