这篇文章介绍使用Python处理PDF文件的编辑任务。分为几个不同的部分:加密PDF,提取PDF的文字内容,合并PDF文件,添加水印。
加密PDF文件
我们先来拷贝一份PDF文件,然后对它加密。在这里,需要使用到库PyPDF2,如果没有的话,需要提前安装: pip3 install PyPDF2,所有的读写操作都可以由它完成,对于文件加密,它提供了非常方便的接口PdfFileWriter::encrypt,接下来看看例子。
code snippet:
import PyPDF2
fileName = "/Users/weiyang/Desktop/Test.pdf"
newFileName = "/Users/weiyang/Desktop/NewTest.pdf"
file = open( fileName, 'rb' )
reader = PyPDF2.PdfFileReader( file )
writer = PyPDF2.PdfFileWriter()
for pageIndex in range( reader.numPages ):
writer.addPage( reader.getPage( pageIndex ) )
writer.encrypt( 'bell' ) #passwd
newFile = open( newFileName, "wb" )
writer.write( newFile )
newFile.close()
file.close()
result:
如果不想保留原始的文件,可以使用OS库中的renam