下载安装pdf插件
其中天诺下载开源版本5.2,新版本已收费,不适合白嫖
PdgCntEditor是校正页码和格式的工具,其实使用脚本也可以,考虑到部分扫描出来的格式问题各不一样,就没写脚本处理了。直接手撸
FreePic2Pdf工具是导出和导入书签目录源码的工具,下面介绍
V0505是获取文献SS码的工具
还有这个截图神器,长截图解决了QQ截图的限制特点,一键宏操作,导出pdf,nice~
目录清洗
-
使用FastStone Capture将pdf目录截图下载保存成pdf文件
-
由于开源ocr识别能力感人,这里使用了付费版的[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oGkLO3UY-1622387168713)(https://ocr.wdku.net/convList)]
-
转成txt文件后进行校对清洗,正则删除一些脏数据,对标题缩进处理
\t
页码和标题间隔符空格
-
打开FreePic2Pdf 如下操作
具体清洗的方法参考[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2Wolxmaz-1622387168718)(https://zhuanlan.zhihu.com/p/170590863)]
如果找不到PdgCntEditor路径,可以自己打开,也一样的,处理完复制进源文件就行
使用参考
导入目录
格式都弄好之后就可以导入目录了,将格式处理好后
使用FreePic2Pdf导入书签就Ok了。就很nice~~