![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
文章平均质量分 87
非长道
这个作者很懒,什么都没留下…
展开
-
pdf文档解析
Adobe的PDF参考告诉我们一个PDF文件可以通过下面4个方面来理解: 1. 对象 ,2. 文件 (物理结构)3. 文档结构4. 内容流转载 2017-02-27 09:48:00 · 17619 阅读 · 5 评论 -
PDF 参照流/交叉引用流对象(cross-reference stream)的解析方法
采用交叉引用流对象有以下几点好处:1) 压缩后存储的信息更紧凑;2) 可以访问存储在对象流中的压缩对象,并允许以后加入新的参照选项类型。转载 2017-05-15 15:30:23 · 4010 阅读 · 2 评论 -
PDF 格式
一、PDF文件结构 1.header:2.body:3.cross reference table:4.trailer:原创 2017-02-24 18:31:04 · 1235 阅读 · 0 评论 -
PDF 中图片的提取
1.1 PDF 文件图像分类PDF 文件中的图像分为两类:①图像外部对象(XObject):在内容流 (content stream) 之外定义的一个有名字的被引用对象。一个XObject的内部阐述依赖于它的类型;②内嵌图像(in-line image):直接把图像属性和数据嵌在一个内容流里的小图像。能用这种方式呈现的图像种类是有限的,通常该图像大小在 4 KB 之内。 2 从 P转载 2017-06-17 17:16:29 · 2597 阅读 · 0 评论