pdf2word
一个开源的python库, 用起来还行, 但公式翻译存在问题, 格式也是按页转换的, 不连贯, 需要手动调整, 不过也算勉强能用, 用起来非常简单.
pip install pdf2docx
之后就可以在python脚本中import
了.
- github链接(其实如果只是使用的话没必要了解源码): https://github.com/dothinking/pdf2docx
- 项目简介: https://zhuanlan.zhihu.com/p/352197656
- 使用教程: https://dothinking.github.io/pdf2docx/index.html
latex2word
直接从latex源文件中读取数据, 因此对公式的支持很好, 但对额外引用的图表支持一般, 用起来也蛮简单的.
去下载安装包安装完之后直接在控制台输入pandoc input.tex -o output.docx
即可.
- github链接: https://github.com/jgm/pandoc/releases/
- 知乎简介和简单的使用说明: https://zhuanlan.zhihu.com/p/455713759
我个人用起来的话, 将前面两者结合使用, 手动将两者的长处结合在一起.
先通过pdf2docx转成word, 然后用latex2word将公式给复制进去, 就能得到一篇差不多的word版了, 当然, 如果要精细的话, 还需要细细修改. 但粗略的用起来感觉还行