PDF(包含数学公式)转word

本文介绍了一种方法将包含数学公式的PDF论文转换为.docx格式,主要涉及mathpix、Typora和pandoc工具的使用。首先,通过mathpix截图并识别PDF中的内容,然后在Typora中进行编辑,最后使用pandoc导出为.docx格式。虽然对英文文献支持良好,但可能无法完美识别中文内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 说明

  • 个人需求:需要将一篇pdf格式的论文(包含很多的数学公式)转换成.docx格式。
  • 此方法对英文文献或资料支持非常好,对中文会有识别不出的情况。

2. 工具

  • mathpix:用于截取pdf中的内容并识别其内容。
  • Typora:Typora默认支持 .md文件转 .pdf .html格式,其余的常见格式需要使用 pandoc扩展程序来支持。
  • pandoc:Typora中的一个扩展插件。

3. 实现

第一步:

  • 下载并安装上述的三个工具。

注:

  • pandoc 若遇到下载失败等情况,这位博主提供了一份已经下载好的百度云链接https://blog.csdn.net/jiajikang_jjk/article/details/80380133,同时这位博主也提供了详细的安装过程可供参考。
  • 工具安装完成后可在Typora中写一段话,然后将其转换成.docx格式(转换方法请看第四步)。若转成功,则说明 pandoc 扩展安装成功,否则失败。

第二步

  • 勾选Typora中的内联公式,文件- 偏好设置-Markdown-内联公式。这主要用来识别话语之间的公式。在这里插入图片描述

第三步

  • 打开 pdf文件。
  • 打开 mathpix 软件,点击 左上角的电脑图标(快捷键:Ctrl+Alt+M),选中pdf中的内容。待 mathpix 软件中显示该内容时,将识别出的内容复制(Ctrl+C)到Typora中。在这里插入图片描述

第四步

  • 导出文件为.docx格式。文件-导出-word(.docx)
    在这里插入图片描述

4. 效果

  • 转换前的 pdf 格式
    在这里插入图片描述

  • 转换后 .doc格式
    在这里插入图片描述

参考

https://blog.csdn.net/jiajikang_jjk/article/details/80380133

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值