使用 PyPDF2 操作 pdf 文件
Python 中读写 pdf 文件最常用的模块是 PyPDF2。
PyPDF2 将读与写分成两个类来操作:
from PyPDF2 import PdfFileWriter, PdfFileReader
writer = PdfFileWriter()
reader = PdfFileReader(open("document1.pdf", "rb"))
如果是要修改一个已有的 pdf 文件,可以将 reader 的页面添加到 writer 中:
writer.appendPagesFromReader(reader)
添加书签:
writer.addBookmark(title, pagenum, parent=parent)
一个包含添加书签方法的类:
# -*- coding: utf-8 -*-
import os
from PyPDF2 import PdfFileWriter, PdfFileReader
class Pdf(object):
def __init__(self, path):
self.path = path
reader = PdfFileReader(open(path, "rb"))
self.writer = PdfFileWriter()
self.writer.appendPagesFromReader(reader)
self.writer.addMetadata(reader.getDocumentInfo())
@property