day 9-Python操作pdf文件

亲爱的阿瞎

已于 2023-02-16 20:42:51 修改

阅读量220

点赞数

文章标签： python pdf 开发语言

于 2023-02-16 20:41:48 首次发布

本文链接：https://blog.csdn.net/m0_70367168/article/details/129070617

版权

day 9-Python操作pdf文件

一、PyPDF2的使用

#加载PyPDF2包
from PyPDF2 import PdfReader, PdfWriter

1. pdf文件读操作

1)创建reader

reader = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')

2)获取总的页数

num = reader.getNumPages()
print(num)

3)获取指定的页（页数从0开始）

p1 = reader.getPage(0)
p2 = reader.getPage(2)

2.pdf文件写操作

创建空的pdf

writer = PdfWriter()

1)添加指定页

writer.addPage(p1)
writer.addPage(p2)

2)添加空白页

writer.addBlankPage()

3)插入指定页

writer.insertPage(p1, 2)
# 保存
writer.write('files/new.pdf')

3.练习

1.给MySQL.pdf文件添加封面

2.将两个pdf文件合并成一个pdf文件

3.删除pdf文件中所有下标为奇数的页(下标从0开始)

4.在pdf文件中的每一页的后添加都添加一个空白页

from PyPDF2 import PdfReader, PdfWriter
reader = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
reader1 = PdfReader('files/MySQL.pdf')
writer = PdfWriter()
writer1 = PdfWriter()
writer2 = PdfWriter()
writer3 = PdfWriter()
#1)
p1 = reader.getPage(0)
writer.insertPage(p1, 0)
num1 = reader1.getNumPages()
for n in range(num1):
    p = reader1.getPage(n)
    writer.insertPage(p, n+1)
writer.write('files/new1.pdf')
#2)
num = reader.getNumPages()
num1 = reader1.getNumPages()
for n1 in range(num):
    p1 = reader.getPage(n1)
    writer1.insertPage(p1, n1)
for n2 in range(num1):
    p2 = reader1.getPage(n2)
    writer1.insertPage(p2, num+n2)
writer1.write('files/new2.pdf')
#3)
for n3 in range(num):
    if n3 % 2 == 0:
        p3 = reader.getPage(n3)
        writer2.insertPage(p3, n3)

writer2.write('files/new3.pdf')
#4)
for n4 in range(num):
    p4 = reader.getPage(n4)
    writer3.addPage(p4)
    writer3.addBlankPage()
writer3.write('files/new4.pdf')

二、添加水印

1.准备水印页面

from PyPDF2 import PdfWriter, PdfReader
import os

# 补充：获取文件夹中所有的文件的名字： os.listdir(文件夹地址)
result = os.listdir('files')

reader1 = PdfReader('files/water.pdf')
water = reader1.getPage(0)

2.准备需要添加水印的文件

reader2 = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
page = reader2.getPage(0)

3.添加水印

page.mergePage(water)

4.将添加完水印的页面添加到空的pdf中

writer = PdfWriter()
writer.addPage(page)
#保存
writer.write('files/水印1.pdf')

5.练习

练习:给pdf文件的每一页都添加上水印

water = PdfReader('files/water.pdf').getPage(0) #水印页
reader = PdfReader('files/MySQL.pdf')
writer = PdfWriter() #创建空pdf

for x in range(reader.getNumPages()):
    page = reader.getPage(x)
    page.mergePage(water)
    writer.addPage(page)
#保存
writer.write('files/mysql(水印).pdf')

三、创建水印

# 用来创建画布（创建空白的pdf文件）
from reportlab.pdfgen.canvas import Canvas
# 用来对字体进行注册
from reportlab.pdfbase.pdfmetrics import registerFont
from reportlab.pdfbase.ttfonts import TTFont

1.创建一个空白文件（画布）

在指定的位置新建空白的pdf文件：Canvas

file = Canvas('files/MyWater.pdf')

2.添加文字

1）注册字体

registerFont(TTFont('f1','files/font1.ttf'))
registerFont(TTFont('f2','files/font2.ttf'))

2)设置字体名字和字体大小

file.setFont('f1', 60)

3）设置字体颜色

file.setFillColorRGB(139/255, 69/255, 19/255)  #这里的颜色值用RGB值/255

4)旋转

file.rotate(45)

文件对象.drawString(x坐标, y坐标)

file.drawString(450, 200, '你好，世界!')
#保存
file.save()

3.渲染图片

file.rotate(-45)  #还原之前的旋转
file.drawImage('files/smlie.webp', 200, -100)

四、作业

批量给pdf文件添加水印

#创建需要的水印样式
from reportlab.pdfgen.canvas import Canvas
from reportlab.pdfbase.pdfmetrics import registerFont
from reportlab.pdfbase.ttfonts import TTFont
file = Canvas('files/Water1.pdf')

registerFont(TTFont('f1','files/font1.ttf'))
file.rotate(45)
file.setFont('f1', 40)

file.setFillColorRGB(127/255, 225/255, 170/255, 0.6)
file.drawImage('files/笑脸.png', 400, 150, mask='auto')
file.drawString(400, 50, 'Good afternoon everyone!')
file.drawString(200, -80, '你好，世界!')
file.save()

#批量添加水印
#创建input文件夹保存需要添加水印的pdf
#创建out文件夹保存已添加水印的pdf文件
from PyPDF2 import PdfWriter, PdfReader
import os 
#os.listdir(文件夹地址):获取文件夹中所有的文件的名字 

result = os.listdir('input')
print(result)
reader1 = PdfReader('files/Water1.pdf')
water = reader1.getPage(0)
for pdf in result:
    writer = PdfWriter()
    reader = PdfReader('input/'+pdf)
    num = reader.getNumPages()
    for p in range(num):
        page = reader.getPage(p)
        page.mergePage(water)
        writer.addPage(page)
    writer.write('out/'+pdf)