去除pdf保护的核心是使用的qpdf的工具,然后通过bat批处理达到批量执行的目的。另外需要注意的是此功能仅仅是去除pdf的保护密码,不是打开pdf时需要的open密码,是两回事。
其实批处理本身也没有几行代码,但是踩的坑可不少,这也是写这次博客的目的。
- 安装qpdf,下载地址:QPDF - Browse Files at SourceForge.net,绿色版解压后在cmd模式下就能用了
- 编写windows bat批处理脚本
@echo off ::qpdf安装路径 set cmd=d:\tools\qpdf\qpdf-10.3.2\bin\qpdf.exe ::被保护的pdf文件,需要注意的是如果此路径下有子目录,会被递归查询。在命令行模式下只有加了/r参数才会递归,但是不知道为什么代码 ::写成bat格式后,递归选项就被默认打开了,而且无法关闭,最后实在是无解了,如果谁能找到方法,还麻烦告知。 ::正是递归的这个问题,所以建议输出目录在其他路径下 set inputpath=d:\pdffile\input\ ::去除保护后的pdf存放目录 set outputpath=d:\pdffile\output\ for %%a in (%inputpath%*.pdf) do ( echo %%a %cmd% --decrypt %inputpath%%%~nxa %outputpath%%%~nxa && echo %%~nxa文件转换成功 || echo %%~nxa文件转换失败 ) pause
刚才说了代码不多,但是踩的坑不少,下面就简单列一下踩过的坑吧,大家可以参考:
1.for循环里的变量使用时有很多限制
FOR 变量是单一字母、分大小写和全局的变量,而且,不能同时使用超过 52 个
命令行模式下通过单%引用
bat批处理模式下通过双%%引用
2.变量赋值时,对于变量的值不需要加任何引号,也不需要考虑转移符和冒号等问题
3.在for循环里正则匹配文件时,在当前目录下匹配到的是不带路径的文件名称,在非当前目录下匹配到的是带路径的文件名。举例来说在in的集合里通过(d:\pdffile\*.pdf)和(*.pdf)匹配到的结果是不一样的
BAT注释方法:
1、:: 注释内容(第一个冒号后也可以跟任何一个非字母数字的字符)
2、rem 注释内容(不能出现重定向符号和管道符号)
3、echo 注释内容(不能出现重定向符号和管道符号)〉nul
4、if not exist nul 注释内容(不能出现重定向符号和管道符号)
5、:注释内容(注释文本不能与已有标签重名)
6、%注释内容%(可以用作行间注释,不能出现重定向符号和管道符号)
7、goto 标签 注释内容(可以用作说明goto的条件和执行内容)
8、:标签 注释内容(可以用作标签下方段的执行内容)