扫描文档PDF创建目录

最新推荐文章于 2025-04-25 16:56:04 发布

於鱼雨遇

最新推荐文章于 2025-04-25 16:56:04 发布

阅读量1.8k

点赞数 1

分类专栏：经验操作分享文章标签：经验分享

本文链接：https://blog.csdn.net/weixin_44309371/article/details/122094396

版权

经验操作分享专栏收录该内容

1 篇文章

订阅专栏

使用场景:扫描版PDF在使用时没有目录很不方便，尤其是导入到goodnotes等软件时。在acrobat中可以手动添加书签，但是效率较低。这里记录下如何批量添加目录，关键点是目录文件的处理。

所示软件:FreePic2PDF 和GVIM

第一步:提取PDF原始的目录信息(FreePic2PDF使用参考)(FreePic2PDF下载地址)

首先取书签，会在当前文件路径生成文件夹，接着修改txt文件，最后挂书签即可。

第二步:制作目录信息包

思路：从当当淘宝等网站复制文字版本目录，利用OCR识别数字目录，最后进行拼接。核心是对TXT的处理，建议熟练使用GVIM。

京东详情页存在具体的目录，但是没有页码。

用gvim新建文件，利用通配符操作进行替换，在小章节前添加Tab(\t)

对页码进行截图，只保留数字，利用OCR在线识别出txt输出，在线OCR网址

注:识别文字可以选择较生僻的，亲测DANISH无误差。

TXT处理

页码需要先合并，同时可能出现一行多个的情况，需要用gvim替换，思路是找数字开头空格结尾，在数字前添加Tab。

最后把两个TXT每一行合并，可以使用脚本，这里使用参考。

txt合并脚本bat，把文件放在同一个文件夹

txt合并脚本bat，把文件放在同一个文件夹
@echo off
set num=0
setlocal enabledelayedexpansion
for /f "delims=" %%a in (1.txt) do (
    if !num! equ 0 (
        set /p str=<2.txt
        echo %%~a !str!>>3.txt
    ) else (
        call:get !num! "%%~a"
    )
    set /a num+=1
)
pause
exit
:get
for /f "skip=%~1 delims=" %%b in (2.txt) do (
    echo %~2 %%b>>3.txt
    goto :eof
)

最终效果