前言:
很多时候,在网上下载的电子书因为是扫描版的,所以,大部分都没有目录,或者有目录但是点击目录无法进行跳转,这对我们的阅读造成了很大的困扰。这次这篇博客主要是分享一些方法来快速为PDF制作目录标签。
一、工具准备
1、下载工具FreePic2Pdf
(1)我们获取目录文件和添加目录都得用这个
(2)下载途径:网上百度,有很多
2、下载ABBYY finereader(很有名的一款OCR文字识别工具)
(1)缺点是付费,不过有30天的试用期
(2)优点是文字识别正确率95%上,还可以直接将识别内容导入excel中,非常方便。除了医学上一些输入法都打不出来的生僻字,其他的文字大部分都能识别。
二、步骤简述
1、获取需要的目录。
2、利用正则表达式将目录替换成需要的
三、步骤详解
1.获取目录:
如果我们需要的目录是纯文字的,可以直接复制粘贴到记事本或者excel中整理格式;如果是图文并茂的,那么可以使用ocr识字软件,不一定是上边推荐的,识字软件很多,看个人喜好;或者,去当当网上找你需要的书的目录,直接复制。下例我使用的是识别软件直接识别,图为整理好后的目录。
对标题层级进行标识的方法:
此处我使用的是excel表格直接对标题层级进行换行。除此以外,还有两种方法。
第一种是用记事本,用tab键进行层级分辨,二级标