pdf.js详细解析

最新推荐文章于 2025-04-23 18:27:00 发布

飞鸿酱

最新推荐文章于 2025-04-23 18:27:00 发布

阅读量2w

点赞数 2

分类专栏： front-end-pdfjs software testing

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38465623/article/details/82118074

版权

software testing 同时被 2 个专栏收录

18 篇文章

订阅专栏

front-end-pdfjs

5 篇文章

订阅专栏

pdf.js可以实现在html下直接浏览pdf文档，是一款开源的pdf文档读取解析插件

pdf.js主要包含两个库文件，一个pdf.js和一个pdf.worker.js，一个负责API解析，一个负责核心解析。

pdf.js可通过pdf文件的地址或pdf数据流获取pdf，具体实现是调用接口函数 PDFJs.getDocument(url/buffer)将pdf载入html，通过canvas处理, 然后渲染pdf文件。将pdf转换成数据流，因为转换成流的话可以解决pdf.js的跨域问题。

pdfjs是在canvas上又盖了一个div，把文本显示在里面的各个小div里的，记得是pdfjs有一个API page.getTextContent().then(function(textContent) ，需要用到的可以查一下如何实现。

官网用的viewer.js：http://mozilla.github.io/pdf.js/web/viewer.html，首先底图是一个Canvas，内容和PDF一样（通过下面介绍的page.render方法可以得到），底图之上是一个textLayer，这一层就是通过page.getTextContent()得到了字体的位置和样式，再覆盖在Canvas上。

可以实现在html下直接浏览pdf文档，是一款开源的pdf文档读取解析插件

pdf.js主要包含两个库文件，一个pdf.js和一个pdf.worker.js，一个负责API解析，一个负责核心解析。

pdf.js可通过pdf文件的地址或pdf数据流获取pdf，具体实现是调用接口函数 PDFJs.getDocument(url/buffer)将pdf载入html，通过canvas处理, 然后渲染pdf文件。将pdf转换成数据流，因为转换成流的话可以解决pdf.js的跨域问题。

pdfjs是在canvas上又盖了一个div，把文本显示在里面的各个小div里的，记得是pdfjs有一个API page.getTextContent().then(function(textContent) ，需要用到的可以查一下如何实现。

官网用的viewer.js：http://mozilla.github.io/pdf.js/web/viewer.html，首先底图是一个Canvas，内容和PDF一样（通过下面介绍的page.render方法可以得到），底图之上是一个textLayer，这一层就是通过page.getTextContent()得到了字体的位置和样式，再覆盖在Canvas上。

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。