提取pdf目录的方法

最新推荐文章于 2024-08-24 17:43:23 发布

北冥鱼_

最新推荐文章于 2024-08-24 17:43:23 发布

阅读量1w

点赞数 2

分类专栏： iOS 文章标签： iOS

iOS 专栏收录该内容

158 篇文章 2 订阅

订阅专栏

理论知识：http://stackoverflow.com/questions/4643489/how-do-i-retrieve-a-page-number-or-page-reference-for-an-outline-destination-in

原理就是：通过CGPDFDocumentGetCatalog方法可以获取pdf的元信息，这是一个类似Dictionary的结构，而目录信息就放在里面，需要自己解析出来。

在这里：https://github.com/below/PDF-Voyeur，有一个人写的开源项目，可以查看pdf的元信息，而我也是根据他的代码来找出pdf的目录的。

比如这本书：

iphone_outlines

用PDF-Voyeur打开之后看到的是这样的：

Voyeur_iphone

/Outlines这个节点代表的就是目录，点开Outlines之后会看到/First和/Last，这两个就是第一个和最后一个目录

Voyeur_iphone_2

而/First下面又包含/Next，所有的目录就像链表一样这样串联起来的。

在目录的节点下面可以看到title，就是目录的名字，但是要找到跳转的页数就不容易了。根据本文第一个链接里面的回答，目录索引的方式有3种（仅我所知道的，我相信肯定还有另外的方式）：

用/Dest来索引，Dest是一个array，这时候/Dest下面第一个对象就是page的对象。跟节点下面的pages对象包含的就是所有的page对象，代表每一页，把/Dest下面的page跟所有的page对比，用==判断，就可以找出页码。需要注意的是pages有的时候下面不直接包含page对象，而是像子目录一样包含了很多层级，需要判断节点的type是pages还是page。
用/Dest索引，但是Dest是一个name，这时候需要在根节点下面的/Dests里面找到对应名字的节点，然后从里面找到page对象，再用类型1里面的方法来找到页数
用/A来索引，这种情况跟第一个类似，只要在/D下面找到page对象就好了

iphone_outlines_a

Voyeur程序下载：Voyeur。(打开没有主界面，需要从菜单File来打开一个pdf文件)

Demo：https://github.com/phaibin/PDFContents

原文链接：http://phaibin.tk/2012/01/06/ti-qu-pdfmu-lu-de-fang-fa

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。