python的pdf分割
需要注意的是需要一份分割的执行表。
具体格式如下:
consult.txt中的格式为;
第几页到第几页 需要保存名称
即(1-2 test)保存的格式为pdf
from PyPDF2 import PdfFileReader, PdfFileWriter
# PDF文件分割
def split_pdf(read_file, out_detail):
try:
fp_read_file = open(read_file, 'rb')
pdf_input = PdfFileReader(fp_read_file) # 将要分割的PDF内容格式话
page_count = pdf_input.getNumPages() # 获取PDF页数
print(page_count) # 打印页数
with open(out_detail, 'r',True,'utf-8')as fp:
# print(fp)
txt = fp.readlines()
# print(txt)
for detail in txt: # 打开分割标准文件
# print(type(detail))
pages, write_file = detail.split() # 空格分组
# write_file, write_ext = os.path.splitext(write_file) # 用于返回文件名和扩展名元组
pdf_file = r'C:\Users\GZTSALFIEL\Desktop\exce