python对PDF文件操作
下载模块PyPDF2
,以页为基本单位对PDF
文件进行读写操作,无法直接操作每一页内容。
PDF
文件读操作
导入函数
from PyPDF2 import PdfFileReader
1.打开文件创建reader对象,相当于PDF
文件对象
reader = PdfFileReader(open('文件路径', 'rb'))
2.获取PDF
文件的总页数
num = reader.getNumPages()
3.获取指定页,返回页对象
PDF文件对象.getPage(页的下标)
获取指定页, 下标从0开始,返回页对象。
PDF
文件写操作
导入函数
from PyPDF2 import PdfFileWriter, PdfFileReader
1.创建writer对象; 会自动创建一个空的PDF
文件
writer = PdfFileWriter()
2.添加页
writer.addPage(页对象)
3.添加空白页
writer.addBlankPage(x, y)
4.保存文件
writer.write(open('保存地址', 'wb'))
PDF
文件合并
1.打开两个需要合并的文件,并且创建一个空的PDF
文件;
2.添加页,将两个文件的内容都取出来以需要的顺序添加到新文件中
3.保存文件
PDF
文件页面操作
1.旋转
旋转的返回值是原页面旋转后的页面
页对象.rotateClockwise(旋转角度)
2.缩放
页对象.scale(x, y)
3.合并(添加水印)
需要添加水印的页对象.mergePage(水印的页对象)