day 9-Python操作pdf文件
一、PyPDF2的使用
#加载PyPDF2包
from PyPDF2 import PdfReader, PdfWriter
1. pdf文件读操作
1)创建reader
reader = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
2)获取总的页数
num = reader.getNumPages()
print(num)
3)获取指定的页(页数从0开始)
p1 = reader.getPage(0)
p2 = reader.getPage(2)
2.pdf文件写操作
创建空的pdf
writer = PdfWriter()
1)添加指定页
writer.addPage(p1)
writer.addPage(p2)
2)添加空白页
writer.addBlankPage()
3)插入指定页
writer.insertPage(p1, 2)
# 保存
writer.write('files/new.pdf')
3.练习
1.给MySQL.pdf文件添加封面
2.将两个pdf文件合并成一个pdf文件
3.删除pdf文件中所有下标为奇数的页(下标从0开始)
4.在pdf文件中的每一页的后添加都添加一个空白页
from PyPDF2 import PdfReader, PdfWriter
reader = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
reader1 = PdfReader('files/MySQL.pdf')
writer = PdfWriter()
writer1 = PdfWriter()
writer2 = PdfWriter()
writer3 = PdfWriter()
#1)
p1 = reader.getPage(0)
writer.insertPage(p1, 0)
num1 = reader1.getNumPages()
for n in range(num1):
p = reader1.getPage(n)
writer.insertPage(p, n+1)
writer.write('files/new1.pdf')
#2)
num = reader.getNumPages()
num1 = reader1.getNumPages()
for n1 in range(num):
p1 = reader.getPage(n1)
writer1.insertPage(p1, n1)
for n2 in range(num1):
p2 = reader1.getPage(n2)
writer1.insertPage(p2, num+n2)
writer1.write('files/new2.pdf')
#3)
for n3 in range(num):
if n3 % 2 == 0:
p3 = reader.getPage(n3)
writer2.insertPage(p3, n3)
writer2.write('files/new3.pdf')
#4)
for n4 in range(num):
p4 = reader.getPage(n4)
writer3.addPage(p4)
writer3.addBlankPage()
writer3.write('files/new4.pdf')
二、添加水印
1.准备水印页面
from PyPDF2 import PdfWriter, PdfReader
import os
# 补充:获取文件夹中所有的文件的名字: os.listdir(文件夹地址)
result = os.listdir('files')
reader1 = PdfReader('files/water.pdf')
water = reader1.getPage(0)
2.准备需要添加水印的文件
reader2 = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
page = reader2.getPage(0)
3.添加水印
page.mergePage(water)
4.将添加完水印的页面添加到空的pdf中
writer = PdfWriter()
writer.addPage(page)
#保存
writer.write('files/水印1.pdf')
5.练习
练习:给pdf文件的每一页都添加上水印
water = PdfReader('files/water.pdf').getPage(0) #水印页
reader = PdfReader('files/MySQL.pdf')
writer = PdfWriter() #创建空pdf
for x in range(reader.getNumPages()):
page = reader.getPage(x)
page.mergePage(water)
writer.addPage(page)
#保存
writer.write('files/mysql(水印).pdf')
三、创建水印
# 用来创建画布(创建空白的pdf文件)
from reportlab.pdfgen.canvas import Canvas
# 用来对字体进行注册
from reportlab.pdfbase.pdfmetrics import registerFont
from reportlab.pdfbase.ttfonts import TTFont
1.创建一个空白文件(画布)
在指定的位置新建空白的pdf文件:Canvas
file = Canvas('files/MyWater.pdf')
2.添加文字
1)注册字体
registerFont(TTFont('f1','files/font1.ttf'))
registerFont(TTFont('f2','files/font2.ttf'))
2)设置字体名字和字体大小
file.setFont('f1', 60)
3)设置字体颜色
file.setFillColorRGB(139/255, 69/255, 19/255) #这里的颜色值用RGB值/255
4)旋转
file.rotate(45)
文件对象.drawString(x坐标, y坐标)
file.drawString(450, 200, '你好,世界!')
#保存
file.save()
3.渲染图片
file.rotate(-45) #还原之前的旋转
file.drawImage('files/smlie.webp', 200, -100)
四、作业
批量给pdf文件添加水印
#创建需要的水印样式
from reportlab.pdfgen.canvas import Canvas
from reportlab.pdfbase.pdfmetrics import registerFont
from reportlab.pdfbase.ttfonts import TTFont
file = Canvas('files/Water1.pdf')
registerFont(TTFont('f1','files/font1.ttf'))
file.rotate(45)
file.setFont('f1', 40)
file.setFillColorRGB(127/255, 225/255, 170/255, 0.6)
file.drawImage('files/笑脸.png', 400, 150, mask='auto')
file.drawString(400, 50, 'Good afternoon everyone!')
file.drawString(200, -80, '你好,世界!')
file.save()
#批量添加水印
#创建input文件夹保存需要添加水印的pdf
#创建out文件夹保存已添加水印的pdf文件
from PyPDF2 import PdfWriter, PdfReader
import os
#os.listdir(文件夹地址):获取文件夹中所有的文件的名字
result = os.listdir('input')
print(result)
reader1 = PdfReader('files/Water1.pdf')
water = reader1.getPage(0)
for pdf in result:
writer = PdfWriter()
reader = PdfReader('input/'+pdf)
num = reader.getNumPages()
for p in range(num):
page = reader.getPage(p)
page.mergePage(water)
writer.addPage(page)
writer.write('out/'+pdf)
结果图: