弄这个仓库的主要原因是想方便的使用ChatPDF, 压缩后就可以让它来处理长一些的pdf了。
pdf-compressor
介绍
仓库链接
pdf-compressor是一个轻量级工具,用于压缩PDF文件的页面和大小。压缩会丢失原始文件的格式,只有文本信息会保存在压缩后的结果中。
通过压缩后的文档可以用来体验免费版的ChatPDF功能。
使用默认字体大小10进行压缩的效果如下:
$ python main.py -i input.pdf
文件大小(KB):15114.015----> 45.828
页面数量:23 --------> 15
通过将字体大小设置为5来进一步压缩:
$ python main.py -i input.pdf -f 5
文件大小(KB):15114.015----> 31.638
页面数量:23 --------> 4
下面是一个从左到右显示的压缩过程:原始文件 -> 压缩文件 -> 字体大小为5的压缩文件。
要求
在Python 3.X环境中,通过pip install -r requirements.txt安装依赖项。
用法
克隆存储库,将PDF文件放置在./files
文件夹中。运行python main.py -h
以检查参数的含义。一个典型的用法命令是:
python main.py -i input.pdf
输出文件保存在./files
文件夹中,名称以_compressed.pdf
结尾。下面列出了所有参数的含义:
'-b','--base-path',default = './files',type = str,help ='用于处理PDF文件的基本路径'
'-i','--input-files',required = True,nargs = '+',help ="输入PDF文件名,两个文件之间添加空格"
'-f','--font-size',default = 10,help ="输出PDF的字体大小"