如何使用python 给PDF生成目录
主要步骤:
步骤1.
准备目录的txt,如果PDF是图片无法复制出来,可以使用qq图文识别提取目录内容。
目录txt 格式:
关于QQ图片文字提取:
(1)利用qq聊天框中的屏幕识图
(2)转为在线文档
(3)复制目录内容生成一个txt 文件
把页面前面的点去掉
步骤2
执行python 脚本生成目录,会生成一个原文件名-new的PDF文件
import re
import sys
from distutils.version import LooseVersion
from os.path import exists, splitext
from PyPDF2 import PdfFileReader, PdfFileWriter
is_python2 = LooseVersion(sys.version) < '3'
def _get_parent_bookmark(current_indent, history_indent, bookmarks):
'''The parent of A is the nearest bookmark whose indent is smaller than A's
'''
assert len(history_indent) == len(bookmarks)
if current_indent == 0:
return None
for