PDF根据目录信息格式化并生成大纲标签

工具

freepic2pdf
vscode

提取pdf标签信息

在这里插入图片描述
提取出两个文件。
在这里插入图片描述

itf文件里修改目录起始页码,如:此pdf第14页对应书籍的第一页。
在这里插入图片描述
将BasePage改为对应的起始页码。
在这里插入图片描述
txt文件内就是目录信息,接下来先要在网上(如豆瓣)找到对应书籍的目录信息,当然也可以使用OCR扫描目录生成对应文字信息。

在这里插入图片描述
但此格式不符合我们的需要,因此要重新格式化。

格式化目录信息

vscode打开提取出来的FreePic2Pdf_bkmk.txt文件,并将目录信息复制进去。
我们需要的格式为:

格式化后:
第一部分 标 题    91章 标题    10
        1.1 标题    11
            1.1.1 标 题    12

几个要点:

  1. 章节(小节)数和章节(小节)名之间有一个空格
  2. 章节(小节)名和页码之间一个制表符(\t)
  3. 每一个子章节(小节)比上一层级多一个制表符(\t)

初始格式化

由于网络上能找到的目录格式混杂,因此直接全部初始化为基本格式。
在这里插入图片描述

页码

正则表达式查找

(\d{1,3})$
//行尾匹配,寻找行末有1到3个数字结尾的数字,并且括号内的为分组1

替换

\t$1
//替换为一个制表符,$1代表括号内的分组1

在这里插入图片描述

一级标题

一般为“第X章”。
正则查找

^((\d|\D)+)

如果是“第一部分”这类格式,也可为

^(.*部分)

替换为

$1 

在这里插入图片描述

//$1代表括号内的第一个分组
//注意$1后有一个空格

三级标题

行头匹配,因此倒序替换(先三级标题,后二级标题,如有更多级标题也是从后往前匹配替换)。
“1.1.1”类型格式
正则匹配

^(\d+\.\d+\.\d+)

替换

\t\t$1 
//三级标题有两个制表符,并且最后有一个空格

在这里插入图片描述
“一、二、三、”类型格式
正则匹配

^(.|..)

替换

\t\t$1

二级标题

正则匹配

^(\d+\.\d+)

替换

\t$1 
//二级标题有一个制表符,且最后有一个空格

在这里插入图片描述

成品展示

在这里插入图片描述

合并目录标签

使用freepic2pdf,更改pdf,挂载书签。
注意如果pdf在其他软件中打开,先关闭之后再进行挂载。
在这里插入图片描述

最终成果展示

在这里插入图片描述

扩展阅读

PdgCntEditor教程
Pdf补丁丁(根据文档结构自动生成目录)

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: WPS Office是一款功能强大的办公软件,其中包含了WPS Writer文档编辑器和WPS PDF转换器。 WPSPDF自动生成目录功能可以很方便地为PDF文档生成目录。操作步骤如下: 首先,将需要生成目录的文档转换为PDF格式。可以在WPS Writer中打开文档,然后点击菜单栏中的"文件",选择"转换为PDF",将文档保存为PDF格式。 接着,在WPS PDF转换器中打开刚才保存的PDF文件。点击工具栏中的"目录"按钮,系统将自动扫描文档内容,并根据章节标题、子标题等信息生成目录生成目录列表将显示在PDF文档的侧边栏中,用户可以根据需要将其打开或关闭。 如果文档中有标题或内容发生变化,可以重新点击"目录"按钮进行更新。系统将重新扫描文档并生成新的目录。 此外,用户还可以自定义目录样式。点击工具栏中的"目录选项"按钮,可以设置目录的字体、字号、颜色等属性。 需要注意的是,要正确生成目录,文档中的章节标题、子标题等必须使用WPS Writer的相关样式进行标记。例如,将章节标题设置为"标题1"样式,子标题设置为"标题2"样式。 总之,WPSPDF自动生成目录功能使得对于含有复杂章节结构的文档,用户可以很方便地生成目录列表,提升文档的可读性和导航性。这一功能的使用也非常简单,只需几步操作即可完成目录生成。 ### 回答2: WPS PDF是一款功能强大的PDF编辑器,其中自动生成目录功能让用户能够轻松地为文档添加目录。 首先,打开WPS PDF并加载你想要自动生成目录PDF文档。在左侧的“工具”栏中,你会看到一个名为“大纲”的选项。点击它,你将看到一个弹出窗口。 接下来,你需要标记出你想要在目录中显示的部分标题。在文档中选择第一个标题并在“大纲”窗口中点击“添加”。这将添加第一级标题。 如果文档中有更多级别的标题,你可以在“大纲”窗口中选择相应级别,然后选择相应标题并点击“添加”。通过这种方式,你可以为文档中的多个标题添加目录级别。 完成所有标题的标记后,点击“生成目录”按钮。WPS PDF将根据你在“大纲”窗口中添加的标题自动创建目录。你可以选择将目录插入到当前页面或者作为整个文档的最后一页。 生成目录后,你可以对其进行进一步的调整和编辑。你可以添加页码,格式化目录的样式以及调整标题的层次结构。通过使用WPS PDF的其他编辑功能,你还可以为目录添加书签、链接等。 最后,保存你的文档,并在需要时打印或分享。现在,你已经成功地使用WPS PDF自动生成了一个含有目录PDF文档。 总之,WPS PDF的自动生成目录功能为用户提供了一个简便而强大的工具,使他们能够快速创建具有标准格式的目录,提高文档的可读性和导航性。 ### 回答3: WPS PDF是一款功能强大的PDF编辑工具,它不仅可以编辑和转换PDF文件,还有自动生成目录的功能。 在使用WPS PDF自动生成目录功能的时候,首先我们需要打开需要编辑的PDF文件。然后,点击软件界面上方的“导航”选项卡,接着点击“目录”按钮。 在弹出的目录管理窗口中,我们可以选择自动生成目录的样式。WPS PDF提供了多种不同的样式可供选择,包括带数字标签、带点标签、不带标签等。我们可以根据自己的需求选择相应的样式。 接下来,我们需要选择生成目录的范围。WPS PDF支持生成整个文档的目录,也支持根据文档的标题级别生成目录。如果我们只想生成某几个章节的目录,可以选择相应的章节进行生成。 在确定样式和范围后,我们点击“确定”按钮即可生成目录。WPS PDF会根据文档的标题级别自动生成目录,并将其插入到文档的指定位置。 生成目录后,我们可以对目录进行进一步的编辑。例如,可以修改目录的字体、样式和标题级别等。只需要选中目录,然后点击界面上方的“样式”选项卡,进行相应的编辑即可。 总之,WPS PDF提供了便捷的自动生成目录功能,可以帮助我们更好地组织和管理PDF文件的内容。无论是编辑大型报告还是整理学习资料,WPS PDF都能提供高效的工具和功能,让我们的工作更加便捷和高效。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值