为PDF添加书签目录
准备软件如下:
- pdf-bookmark——将纯文本目录导入PDF自动生成书签
- ABBYY FineReader 15——一个OCR识别工具,用来将PDF中的目录页面识别并导出为纯文本格式
- UltraEdit——一个文本编辑器,对导出的纯文本的目录进行一些修善
准备知识如下:
- 正则表达式语法(很简单,一个小时左右就学会了)
具体操作
- 将PDF电子书中的几张目录页面单独提取出来成为一个pdf文件
目录.pdf
- 用ABBYY FineReader 15打开
目录.pdf
,导出为纯文本文件目录.txt
- 用UltraEdit打开
目录.txt
- 利用正则表达式的相关知识,查找、替换部分字符,修善
目录.txt
使其变得符合如下标准,例:
第1章 基础A1 1
1.1 Scala解释器1
1.2 声明值和变量 3
1.3 常用类型 4
1.4 算术和操作符重载 5
1.5 调用函数和方法 7
1.6 apply方法8
1.7 Scaladoc9
- 将最终的标准格式目录复制粘贴到pdf-bookmark中生成含有标签的PDF电子书