一、 pypdf2的使用
pdf文件读操作
from PyPDF2 import PdfReader, PdfWriter
# 1)创建reader
reader = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
# 2)获取总的页数
num = reader.getNumPages()
print(num)
# 3)获取指定的页(页数从0开始)
p1 = reader.getPage(0)
p2 = reader.getPage(1)
pdf文件写操作
# 创建一个空的pdf
writer = PdfWriter()
# 1)添加指定页
writer.addPage(p1)
writer.addPage(p2)
# 2)添加空白页
writer.addBlankPage()
# 3)插入指定页
writer.insertPage(p1, 2)
# 保存
writer.write('files/new.pdf')
练习:
from PyPDF2 import PdfReader, PdfWriter
# 1.给MySQL.pdf文件添加封面
# 1)准备封面
reader1 = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
cover = reader1.getPage(0)
# 2)需要添加封面的文件的reader
reader2 = PdfReader('files/MySQL.pdf')
# 3)准备空的pdf
writer = PdfWriter()
# 4)往空的pdf中加页面
writer.addPage(cover)
for x in range(reader2.getNumPages()):
page = reader2.getPage(x)
writer.addPage(page)
# writer.write('files/MySQL.pdf')
# 2.将两个pdf文件合并成一个pdf文件
# 1)准备需要合并pdf文件对应的reader
reader1 = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
reader2 = PdfReader('files/MySQL.pdf')
# 2)准备空的pdf对应的writer
writer = PdfWriter()
# 3)依次添加reader中的页面
for x in range(reader1.getNumPages()):
page = reader1.getPage(x)
writer.addPage(page)
for x in range(reader2.getNumPages()):
page = reader2.getPage(x)
writer.addPage(page)
writer.write('files/合并.pdf')
# 3.删除pdf文件中所有下标为奇数的页(下标从0开始)
# 1)准备需要删除页面的pdf
reader = PdfReader('files/MySQL.pdf')
# 2)准备新的pdf
writer = PdfWriter()
# 3)将下标为偶数的页添加到新的pdf中
for x in range(0, reader.getNumPages(), 2):
page = reader.getPage(x)
writer.addPage(page)
writer.write('files/new_mysql.pdf')
# 4.在pdf文件中的每一页的后添加都添加一个空白页
reader = PdfReader('files/MySQL.pdf')
writer = PdfWriter()
for x in range(reader.getNumPages()):
page = reader.getPage(x)
writer.addPage(page)
writer.addBlankPage()
writer.write('files/new_mysql2.pdf')
二、 添加水印
from PyPDF2 import PdfWriter, PdfReader
import os
# 补充:获取文件夹中所有的文件的名字: os.listdir(文件夹地址)
result = os.listdir('files')
# 1.准备水印页面
reader1 = PdfReader('files/water.pdf')
water = reader1.getPage(0)
# 2.准备需要添加水印的文件
reader2 = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
page = reader2.getPage(0)
# 3.添加水印
page.mergePage(water)
# 4.将添加完水印的页面添加到空的pdf中
writer = PdfWriter()
writer.addPage(page)
writer.write('files/水印1.pdf')
练习:给pdf文件的每一页都添加上水印
water = PdfReader('files/water.pdf').getPage(0)
reader = PdfReader('files/MySQL.pdf')
writer = PdfWriter()
for x in range(reader.getNumPages()):
page = reader.getPage(x)
page.mergePage(water)
writer.addPage(page)
writer.write('files/mysql(水印).pdf')
三、 创建水印
# 用来创建画布(常见空白的pdf文件)
from reportlab.pdfgen.canvas import Canvas
# 用来对字体进行注册
from reportlab.pdfbase.pdfmetrics import registerFont
from reportlab.pdfbase.ttfonts import TTFont
# 1.创建一个空白文件(画布)
# 在指定的位置新建空白的pdf文件:Canvas(文件路径)
file = Canvas('files/MyWater.pdf')
# 2.添加文字
# 1)注册字体
registerFont(TTFont('f1', 'files/font1.ttf'))
registerFont(TTFont('f2', 'files/font2.ttf'))
# 2)设置字体的名字和字体大小
file.setFont('f2', 40)
# 3)设置字体颜色
# r、g、b: 0 ~ 1
# 透明度:0 ~ 1
file.setFillColorRGB(139/255, 69/255, 19/255, 0.7)
# 4)旋转
file.rotate(45)
# 文件对象.drawString(x坐标, y坐标, )
file.drawString(200, 100, '你好世界!')
file.rotate(-45)
file.setFont('f1', 12)
file.setFillColorRGB(180/255, 180/255, 180/255, 0.7)
file.drawString(100, 0, 'hello world!')
# 3.渲染图片
# 文件对象.drawImage(图片地址, x坐标, y坐标, mask='auto')
file.drawImage('files/car.png', 0, 0, mask='auto')
# 保存
file.save()
作业
from reportlab.pdfgen.canvas import Canvas
from reportlab.pdfbase.pdfmetrics import registerFont
from reportlab.pdfbase.ttfonts import TTFont
file = Canvas('files/MyWaterMark.pdf')
registerFont(TTFont('f1', 'files/aa.ttf'))
registerFont(TTFont('f2', 'files/dd.ttf'))
file.setFont('f1', 50)
file.setFillColorRGB(255/255, 228/255, 225/255, 0.5)
file.rotate(30)
file.drawString(400, 300, '未来数据分析CEO')
file.drawImage('files/dog.png', 100, 0, mask='auto', width=100, height=100)
file.rotate(-45)
file.save()
from PyPDF2 import PdfWriter, PdfReader
import os
w_reader = PdfReader('files/MyWaterMark.pdf')
water = w_reader.getPage(0)
result = os.listdir('input')
print(result)
for i in result:
# 准备需要添加的水印文件
reader = PdfReader("input/"+i)
writer = PdfWriter()
for j in range(reader.getNumPages()):
page = reader.getPage(j)
page.mergePage(water)
writer.addPage(page)
writer.write('out/' + i)
结果展示: