pdfjs ----本地以及远程访问pdf文件

如何下载pdfjs,可查看我的另外一篇博客文章 

https://blog.csdn.net/qiumen/article/details/82698471

一、本地访问

1.把pdfjs放到项目,可把pdf.js和pdf.worker.js放到另外专门的js文件夹(放置位置自己调,pdf.min.js以及pdf.worker.min.js是去网上找自动压缩工具压缩的,你自己要不要压缩随你的便)

2.打开viewer.js文件,ctrl+f 搜索‘DEFAULT_URL’查看默认文件位置,也就是说,你直接在网上打开文件的时候就可以默认打开这个文件了,下载的pdf文件里面会默认带有这个文件

如果想要修改文件的话,改掉文件名,以及把文件放在pdfweb下面下,与刚才的pdf文件同级,具体自己修改文件路径

3.如果想要浏览其它pdf文件的话,我们的访问方式也可以这样表示:

http://localhost:9528/static/pdfweb/viewer.html?file=a.pdf

注意file文件的路径,放在pdfweb下,否则可能读不到,如果不放到pdfweb下也行,但访问的路径要写对

本地访问比较简单,接下来是远程访问了,接下来我会把我所遇到的问题都尽可能写出来。

二、远程访问

一般项目是MVVM的话,前后端分离,一般都是远程访问,即访问远程服务器

1、远程访问的话,远程文件名也可以放在file后面: http://localhost:9528/static/pdfweb/viewer.html?file=******.pdf

但远程访问的话,file后面肯定会跟http地址,浏览器会因识别不了两条http而报出奇奇怪怪的原因,因此file后面的文件需要编码,用js自带函数encodeURIComponent编码,把编码后的远程pdf文件的地址放在file后面,这样file后面的文件就是编码后的地址了

2、这样远程访问肯定会有问题的,pdf.js是不支持跨域文件加载的,直接加载是不会成功的。会报  “file origin does not match viewer”错误。这里涉及到前后端的设置

首先先来说前端的设置,打开viewer.js文件

注释掉这个

后端的设置,后端会拒绝访问这个,因此需要远程服务器处理这个pdf的servlet上面设置可任何服务器访问,也可以在过滤器上设置,也可以在服务器上设置,比如ngnix的反向代理机制来解决前端跨域访问的问题,这个在网上也有很多资料,下面讲下在servlet上处理以及在ngnix上处理两种方法:

1)servlet上处理,为了分片处理

2)ngnix反向代理这个如何处理,在nginx配置中加入了这样一句:add_header 'Access-Control-Allow-Origin' '*';

   如图所示:

关于ngnix反向代理可以参照网上这个链接:https://www.cnblogs.com/soukingang/p/5445252.html

以上的方法对于访问远程服务器上的pdf文件或者pdf文件流都可以访问

3.还有一个很重要的问题,关于J2EE跨域资源共享还需要在你的xml上面配置这样一段信息以及加上两个jar包,这个很重要,jar包的获取很容易的,直接去这里下载就行:https://mvnrepository.com/repos/central

1)cors-filter-1.7.1.jar
2)java-property-utils-1.9.1.jar

web项目中的web.xml文件
添加过滤器:
 

 <filter>
   <filter-name>CorsFilter</filter-name>
   <filter-class>com.thetransactioncompany.cors.CORSFilter</filter-class>
</filter>
<filter-mapping>
      <filter-name>CorsFilter</filter-name>
      <url-pattern>/*</url-pattern>
</filter-mapping>

4.另外说一声,就是是返回字节流,其加载方式也可以这样操作的,然后把servlet链接放到file后面即可,注意要用js自带函数encodeURIComponent编码

urlhttp://localhost:9528/static/pdfweb/viewer.html?file=******

5.如果想要隐藏下载功能的话,可以在viewer.html设置这一小段代码,如果源代码看不懂,注释掉可能会引发奇奇怪怪的问题,所以还是加段代码把:style="visibility:hidden"

三、优化pdfjs加载速度(cdn、压缩成min.js、min.css、分片加载)

1、采用cdn加载,不懂的可以网上查询cdn加载的意思以及用处

在pdfjs官方存放代码里,里面有关于cdn加载的路径,以及提供pdfjs提供的地址

https://cdnjs.com/libraries/pdf.js 

如果你没有在插件改过代码的话,你可以直接引用官方提供的cdn地址,比如

注意版本号写对1.9.426,别踩坑,不然显示不出资料,版本号怎么知道是哪个呢,如果你的pdf预览报错,就会显示版本号,因为我在代码没有看到版本号,所以我就通过页面报错找到版本号

如果代码改过就不要引用cdn了,直接压缩,比如我上图的viewer.min.js ,在线压缩工具进行压缩就行了,这样发生产版本的远程加载就会快,注意路径要写对

分片加载

但是如果pdf 文件比较大, 往往会加载比较慢。影响用户体验。假设一个pdf 文件大小为:100M,如何快速的在浏览器打开

前置条件 
第一:web服务器必须要能支持,分片下载。nginx 1.09 版本已上默认的就支持了 
第二:浏览器支持,经过简单测试,谷歌和火狐都支持,谷歌支持的最好.

如何设置分片大小

 PDFJS.getDocument({url:url,rangeChunkSize:65536*16}).then(function(pdfDoc_) {
        pdfDoc = pdfDoc_;
        document.getElementById('page_count').textContent = pdfDoc.numPages;

        // Initial/first page rendering
        renderPage(pageNum);

   }) 
  • rangeChunkSize : 就是分块大小,默认:65536(64k)。默认太小了,这个文档100m,需要有1000多个请求,才能下载完毕。所以我调成成了512k,减少请求数。如果你的pdf文件就是一两页,那么你设置分页没有多大效果,可以说不用设置。另外不同版本,可能设置分页的位置不一样,我现在的版本的话,就设置这个就行了

可参照此链接:https://blog.csdn.net/niedewang/article/details/79883828

 

===============================================================

以上总结的就是遇到的坑,有些步骤我给了,但我没有解释为什么要这样子做,有些你们要自己查原因为什么要这样子处理,如果我全部写了篇幅会很长,如果有疑问可以发表感言,很少写博客,描述文字不严谨,见谅、、告退、、、、

  • 7
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
### 回答1: pdfjs-dist是一个用于加载和渲染PDF文档的JavaScript库。由于安全原因,浏览器默认情况下会阻止跨域加载PDF文件。要解决这个问题,我们可以通过以下步骤来实现pdfjs-dist跨域加载PDF文档: 1. 在服务器端设置CORS(跨域资源共享)头文件。可以在服务器上的响应头中添加Access-Control-Allow-Origin字段,并将其设置为允许访问的域名,以允许跨域加载PDF文件。 2. 在客户端代码中使用XMLHttpRequest对象来加载PDF文件。可以使用XMLHttpRequest对象发送GET请求,并在请求头中添加origin字段以指定服务器的域名。然后,使用responseType属性设置响应类型为blob,以便以二进制格式接收PDF文件。 3. 在接收到响应后,使用FileReader对象读取二进制数据,并将其转换为PDF文件。可以使用FileReader对象的readAsArrayBuffer方法读取blob响应,并在load事件触发时将结果传递给PDFJS库的load方法。 4. 使用PDFJS库的PDFViewer对象来展示加载PDF文件。可以创建一个空的div元素作为容器,并使用PDFViewer对象将其与加载PDF文件关联起来。然后,将PDFViewer对象的container属性设置为之前创建的div元素,并调用PDFViewer对象的render方法来显示PDF文件。 通过以上步骤,我们可以实现pdfjs-dist跨域加载PDF文档的功能。在服务器端进行CORS配置并在客户端代码中使用XMLHttpRequest对象加载PDF文件,最后使用PDFViewer对象展示加载PDF文件。这样可以解决浏览器默认情况下的跨域加载限制,让我们能够在任意域名下使用pdfjs-dist加载和渲染PDF文档。 ### 回答2: pdfjs-dist是一个开源的JavaScript库,用于在Web浏览器中展示PDF文档。当在网页中使用pdfjs-dist加载远程的PDF文件时,可能会遇到跨域加载的问题。 跨域加载是指Web浏览器限制从不同源加载资源的安全策略。默认情况下,浏览器不允许从一个域加载来自另一个域的内容,这在一定程度上是为了防止恶意代码的执行。 要解决pdfjs-dist跨域加载PDF的问题,我们可以采取以下方法: 1. 设置服务器的响应头: 在加载PDF文件的服务器上,可以设置响应头,允许跨域访问。常见的方法是在响应头中加入Access-Control-Allow-Origin字段,其值为需要允许访问的域名或*,表示允许任意域名进行访问。 2. 使用代理服务器: 可以使用一个中间代理服务器来绕过跨域问题。在代理服务器上发起请求获取PDF文件,并将响应返回给浏览器。这种方法可以在服务器端解决跨域问题,但需要额外的服务器资源支持。 3. 使用服务器端转发: 在服务器端设置API,将PDF文件内容作为响应返回给客户端。客户端通过调用这个API来获取PDF文件内容,避免了直接跨域加载的问题。 总之,解决pdfjs-dist跨域加载PDF的问题有多种方法可选,选择合适的方法取决于具体的应用场景和需求。 ### 回答3: PDF.js是一个用于在Web上渲染PDF文件的开源JavaScript库,它提供了以JavaScript为基础的PDF查看器。PDF.js可以跨域加载PDF文件,以下是一些关于如何使用pdfjs-dist来跨域加载PDF的步骤: 1. 首先,下载并在你的网站中引入pdfjs-dist库。你可以从PDF.js的GitHub页面下载最新版本。 2. 在HTML文件中创建一个容器元素来放置PDF查看器: ```html <div id="pdf-viewer"></div> ``` 3. 在JavaScript代码中使用pdfjs-dist库来加载并渲染PDF文件: ```javascript // 设置PDF文件的URL const pdfUrl = 'http://example.com/path/to/pdf-file.pdf'; // 获取容器元素 const container = document.getElementById('pdf-viewer'); // 创建PDF查看器实例 const pdfViewer = new PDFViewer({ container: container }); // 获取PDF文档 PDFJS.getDocument(pdfUrl).promise.then(function(pdfDoc) { // 将PDF文档绑定到查看器实例 pdfViewer.setDocument(pdfDoc); }); ``` 4. 设置正确的跨域请求头(如果需要)。在服务器端,确保使用适当的CORS配置允许来自你网站的跨域请求。 5. 运行你的网站,并在浏览器中查看结果。PDF文件应该成功加载和渲染在指定的容器元素中。 通过以上步骤,你可以使用pdfjs-dist库来跨域加载和显示PDF文件。但是请注意,跨域请求需要在服务器端进行相应的配置,以确保安全性和数据的完整性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值