FreePic2Pdf
source:
批量给pdf添加目录(最完整详细方法) - Ghoset的博客 - CSDN博客blog.csdn.net上文中的FreePic2Pdf百度云链接:
https://pan.baidu.com/s/1kVHzVmfpan.baidu.com密码:at9e
PdgCntEditor
Source:
PDF目录编辑软件-PdgCntEditorwww.jianshu.com上文中的PdgCntEditor微云链接:
链接:
文件分享share.weiyun.com密码:m34bkv
Word查找和替换通配符
Word查找和替换通配符(完全版)_百度文库wenku.baidu.com主要流程
- 找到目录;搜索例如douban,书的原版网站,google books以及最差的情况哪里也找不到就只能OCR,电脑OCR软件很多,手机端可以直接用扫描全能王也算比较方便。
- Word修改目录格式
- FreePic2Pdf提取目录
- PdgCntEditor检查目录文件(但是原则上可以不使用这个软件,如果你能保证Word修改的文件是完全正确的话)
- FreePic2Pdf修改引导文件和生成
一些Tips
- 最多的工作集中在第一项寻找目录和第二项修改目录格式。
- 搜索全拼本事,如果不幸要做OCR简直是灾难。
- Word使用通配符替换需要点击"replace">"more">"Use wildcards".(中文Word也是相对应的一些描述)
- Word查找的通配符和notepad云云不一样,所以上面提供了一个还算全面的通配符链接。主要目的就是为了批量加入制表符(Tab)批量删除某些不必要的数字和'.'。
- 一般来说,FreePic2Pdf识别一段文字顶格无Tab的为一级标题,文字前的Tab为二级标题,两个Tab为三级标题。识别一段文字后的“Tab+数字”为页码。在文字中间的任意地点都不能加Tab。否则你的目录就会无法通过点击到达相应的页面。所以Word通配符的目的就是为了删除不必要的Tab(通常可以先选择删除所有Tab),然后根据一级二级三级目录的类型不同写出相对应的通配符。这个相当简单,只是需要花一点点时间去熟悉一下通配符和书写的规则。
- 特殊字符例如schrodinger中o的两个点,会被错误的识别成中文字符。