LaTeX/PDF转Word最佳实践总结

解决方案

  • 公式部分建议首先尝试使用pandoc转换.tex源文件为Word
  • 表格部分建议首先尝试Adobe Acrobat转换.pdf生成文件为Word
  • 通常情况下可以尝试直接使用Word打开.pdf生成文件

转换方式对比

效果对比仅针对排版布局、插图、表格、公式部分,其余未讨论部分默认在多种转换方式下无明显区别。

pandoc

  • 排版布局上可能存在部分内容丢失,主要排查方向是调用第三方包和排版复杂度
  • 插图可以保持,但排版丢失
  • 表格混乱
  • 公式几乎完美转换

总结:使用pandoc转换.tex.docx更适用于多公式文档。

Word

  • 排版布局上,字体字号等文档设置均发生变换,且行间距可能因为某些原因发生变化
  • 插图有部分缺失,但排版可以保持
  • 表格有一定的识别成功率,但可能解析为图片格式
  • 公式识别成功率较低,但易于修正

总结:使用Word直接打开生成的.pdf文档可以得到最容易二次修改的.docx文档,因为缺失插图可以直接从源文件中重新载入,而公式部分可以借助pandoc的转换结果,排版部分工作量不大,表格部分依赖排版复杂度。

Adobe Acrobat

  • 排版布局几乎可以保持
  • 插图几乎可以保持
  • 表格几乎可以转换
  • 公式识别成功率低,可能还不如使用Word打开的方式,甚至可能影响转换后文档布局

总结:如果文档排版简单,公式少,几乎可以实现完整转换

转换细节

公式

使用pandoc实现.tex.docx的转换

$ pandoc paper.tex -o paper.docx 

表格

  • 首先尝试Adobe Acrobat
  • 其次尝试使用Word直接打开
  • 还不行?尝试单独对表格源码进行转换

插图

  • Adobe Acrobat几乎可以完美保持,如果条件允许请一定尝试。
  • 6
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值