简介
PDF是市面上最流行的格式之一,大多数情况下,PDF文件是可读的,即内部包含文字内容。如果要将这些内容转换为图片,一个办法是一个个页面截图,然而,这样是十分低效率的。这里,笔者分享下如果快速实现在浏览器中将PDF文件转换为图片。
环境要求
一、新建一个目录,在里面打开命令行工具(快捷方式为Ctrl+Shift+右击)通过npm下载本文使用的核心控件
npm install dwt@14.0.3
然后在这个目录可以看到
二、打开到以下目录
node_modules\dwt\samples
可以看到
三、在本文中,我们要重点研究的是 PDFRasterizer.html。直接双击打开。在浏览器中按照提示安装控件
正常情况下,安装的文件可以在 C:\Windows\SysWOW64\Dynamsoft\DynamsoftService 目录中找到。这里的核心文件主要是
DynamsoftService.exe
dwt_trial_14.0.0.0618.dll
DynamicPdf.dll
四、安装完成后,刷新页面,点击第二个按钮并打开本地的一个PDF文件。很快这个PDF文件就会以图片形式展现在页面上的图片查看器中
此时,可以打开浏览器的开发者界面(F12),并试一下执行以下代码。这样可以一次查看多疑图片
DWObject.SetViewMode(3,3);
还可以用以下方法来把这些图片存为JPEG到本地(也可以存为BMP, PNG, TIF等)
DWObject.IfShowFileDialog = true;
DWObject.SaveAsJPEG('');
如果需要了解更多技术细节,可以直接看 PDFRasterizer.html 的JS源码。也可以直接联系免费快速的中国区技术支持
https://www.damingsoft.com/ContactUs.aspx
备注
如果你看到以下提示则表示你用的授权过期了。
解决方案为点击上图中标红的链接,获取一个新的授权并加上下面的代码中的第一句(在window.onload回调函数中)
...
Dynamsoft.WebTwainEnv.ProductKey = "<新的授权>";
Dynamsoft.WebTwainEnv.Load();
...