day9 Python:PyPDF2操作PDF文件
PyPDF2库文件的适用前要进行包的安装
库文件的导入
from PyPDF2 import PdfReader, PdfWriter
1. PDF文件读操作
创建reader对象
reader = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
获取总页数
num = reader.getNumPages()
获取指定页面
下标的访问从0开始
p1 = reader.getPage(0)
p2 = reader.getPage(1)
2. PDF文件写操作
创建writer对象
writer = PdfWriter()
添加指定页
writer.addPage(p1)
writer.addPage(p2)
添加空白页
writer.addBlankPage()
插入指定页
writer.insertPage(p1, 2)
保存新PDF
writer.write('files/new.pdf')
注意:PyPDF2做完所有操作后,保存的都是一个新的PDF文件,如果名字与源文件重合,会将源文件覆盖,因此一般不采用源文件名。
3. 练习
给MySQL.PDF文件添加封面
# 1)准备封面
reader1 = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
cover = reader1.getPage(0)
# 2)需要添加封面的文件的reader
reader2 = PdfReader('files/MySQL.pdf')
# 3)准备空的pdf
writer = PdfWriter()
# 4)往空的pdf中加页面
writer.addPage(cover)
for x in range(reader2.getNumPages()):
page = reader2.getPage(x)
writer.addPage(page)
writer.write('files/MySQL.pdf')
将两个PDF文件合并成一个PDF
# 1)准备需要合并pdf文件对应的reader
reader1 = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
reader2 = PdfReader('files/MySQL.pdf')
# 2)准备空的pdf对应的writer
writer = PdfWriter()
# 3)依次添加reader中的页面
for x in range(reader1.getNumPages()):
page = reader1.getPage(x)
writer.addPage(page)
for x in range(reader2.getNumPages()):
page = reader2.getPage(x)
writer.addPage(page)
writer.write('files/合并.pdf')
删除PDF文件中所有下标为奇数的页
# 1)准备需要删除页面的pdf
reader = PdfReader('files/MySQL.pdf')
# 2)准备新的pdf
writer = PdfWriter()
# 3)将下标为偶数的页添加到新的pdf中
for x in range(0, reader.getNumPages(), 2):
page = reader.getPage(x)
writer.addPage(page)
writer.write('files/new_mysql.pdf')
在PDF文件中的每一页的后面添加一个空白页
reader = PdfReader('files/MySQL.pdf')
writer = PdfWriter()
for x in range(reader.getNumPages()):
page = reader.getPage(x)
writer.addPage(page)
writer.addBlankPage()
writer.write('files/new_mysql2.pdf')
5. 水印操作
准备水印页面
reader1 = PdfReader('files/water.pdf')
water = reader1.getPage(0)
准备需要添加水印的文件
reader2 = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
page = reader2.getPage(0)
添加水印
page.mergePage(water)
writer = PdfWriter()
writer.addPage(page)
6. reportlab制作水印
# 用来创建画布(常见空白的pdf文件)
from reportlab.pdfgen.canvas import Canvas
# 用来对字体进行注册
from reportlab.pdfbase.pdfmetrics import registerFont
from reportlab.pdfbase.ttfonts import TTFont
# 1.创建一个空白文件(画布)
# 在指定的位置新建空白的pdf文件:Canvas(文件路径)
file = Canvas('files/MyWater.pdf')
# 2.添加文字
# 1)注册字体
registerFont(TTFont('f1', 'files/font1.ttf'))
registerFont(TTFont('f2', 'files/font2.ttf'))
# 2)设置字体的名字和字体大小
file.setFont('f2', 40)
# 3)设置字体颜色
# r、g、b: 0 ~ 1
# 透明度:0 ~ 1
file.setFillColorRGB(139/255, 69/255, 19/255, 0.7)
# 4)旋转
file.rotate(45)
# 文件对象.drawString(x坐标, y坐标, )
file.drawString(200, 100, '你好世界!')
file.rotate(-45)
file.setFont('f1', 12)
file.setFillColorRGB(180/255, 180/255, 180/255, 0.7)
file.drawString(100, 0, 'hello world!')
# 3.渲染图片
# 文件对象.drawImage(图片地址, x坐标, y坐标, mask='auto')
file.drawImage('files/car.png', 0, 0, mask='auto')
# 保存
file.save()