专栏导读
-
🌸 欢迎来到Python办公自动化专栏—Python处理办公问题,解放您的双手
-
-
-
-
📕 此外还有python基础专栏:请点击——>Python基础学习专栏求订阅
-
文章作者技术和水平有限,如果文中出现错误,希望大家能指正🙏
-
❤️ 欢迎各位佬关注! ❤️
库的介绍
-
PyPDF2 是一个纯 Python 实现的库,用于处理 PDF 文件。它可以读取、编辑、合并和拆分 PDF 文档,还可以提取文本、图像和其他内容。以下是 PyPDF2 的一些主要用法和示例:
库的安装
pip install PyPDF2 -i https://pypi.tuna.tsinghua.edu.cn/simple/
1、读取pdf内容
import PyPDF2
with open("example.pdf", "rb") as file:
pdf_reader = PyPDF2.PdfFileReader(file)
num_pages = pdf_reader.numPages
print("页数:", num_pages)
metadata = pdf_reader.getDocumentInfo()
print("标题:", metadata.title)
print("作者:", metadata.author)
print("创建时间:", metadata.created)
page = pdf_reader.getPage(0)
text = page.extractText()
print(text)
2、添加水印
import PyPDF2
with open('example.pdf', 'rb') as file, open('watermark.pdf', 'rb') as watermark_file:
pdf_reader = PyPDF2.PdfFileReader(file)
watermark_reader = PyPDF2.PdfFileReader(watermark_file)
pdf_writer = PyPDF2.PdfFileWriter()
watermark_page = watermark_reader.getPage(0)
for page_num in range(pdf_reader.numPages):
page = pdf_reader.getPage(page_num)
page.mergePage(watermark_page)
pdf_writer.addPage(page)
with open('watermarked_document.pdf', 'wb') as output_file:
pdf_writer.write(output_file)
3、加密PDF
import PyPDF2
input_pdf = PyPDF2.PdfFileReader(open('original.pdf', 'rb'))
output_pdf = PyPDF2.PdfFileWriter()
for i in range(input_pdf.getNumPages()):
output_pdf.addPage(input_pdf.getPage(i))
output_pdf.encrypt('password')
with open('encrypted.pdf', 'wb') as outputStream:
output_pdf.write(outputStream)
4、PDF合并
5、PDF拆分
总结
-
希望对初学者有帮助
-
致力于办公自动化的小小程序员一枚
-
希望能得到大家的【一个免费关注】!感谢
-
求个 🤞 关注 🤞
-
-
求个 ❤️ 喜欢 ❤️
-
-
求个 👍 收藏 👍
-