1.如何解析指定页面而不是文档的全部?
2.利用哪些三方库?
一、PDF文档解析
1.将输入尾的文档提取出首页和尾页(import PyPDF2 )
<def getdespdf(self,path):
# print("输出路径为:", self.file_path_out)
fp=open(path,"rb") #打开输入文件路径
fr=PdfFileReader(fp) #读取pdf 输入流
output=PdfFileWriter() #输出流
lastpage = fr.getNumPages() #根据输入流得到pdf文档的总页数
end_index = lastpage - 1
# testnu=fr.getPageNumber()
pages_index =[0,end_index] #首页和尾页的 index 组成一个元组
for i in pages_index:
output.addPage(fr.getPage(i)) #取到首页和尾页,加载进输出流
outputstream = open(self.file_path_out,"wb") #确定提取后需要保存到的位置
output.write(outputstream)#保存首页和尾页 得到一个新的pdf文件
#closed stream
outputstream.close() #常规操作,关闭流
fp.close()