pandoc实现LaTeX转word+公式格式批量转换

LaTeX转docx

1.1 引言

Pandoc 是一款免费且开源的文档格式转化工具,支持众多文本类型之间的转化,而且转化效果相当优秀。本文将介绍使用 Pandoc 将 .tex 转化成 .docx 文件的流程。(只在Windows环境下测试使用)

1.2 pandoc 安装

Pandoc 安装比较简单,可以在 Pandoc 官网 下载和安装最新版本, 或者在 Github Releases 下载需要的版本。(我是采用chocolatey安装,想了解的看这里chocolatey介绍与安装

1.3 基本使用

在 Windows 下打开 DOS 命令窗口(搜索窗口输入cmd)并进入到要转化的 .tex 目标文件的目录(进入E盘 输入:E:)。之后使用命令:

pandoc input.tex -o output.docx

即可将 input.tex (input你自己的文件名)转化成 output.docx(output你想要的文件名)。 input 是输入的文件名,.tex 文件; output 是输出的文件名,注意必须是 .docx 后缀。转化的 .docx 文件不需要和 .tex 文件同名。

1.4 进阶使用

基本命令只能帮你把文章主体转化为word文档,如果你需要一个完整的学术文本,需要使用另一个工具 pandoc-crossref,Windows下,需要从 GitHub Repo下载 pandoc-crossref-Windows.7z,解压后将 pandoc-crossref.exe 粘贴到 Pandoc 的安装目录中。
注意: pandoc-crossref 的版本必须与 pandoc 的版本匹配。

1.4.1 启用 pandoc-crossref

命令后加入

--filter pandoc-crossref 

1.4.1.1 公式编号

-M autoEqnLabels 
-M tableEqns

第一个自动给公式编号
第二个自动对齐(我安装的pandoc版本可能太低了,这个命令老是报错,在完整命令中我给删掉了)

1.4.1.2 标注的编号

Latex 中表格和图片的 \caption 的编号通过以下配置命令自动转化:

-t docx+native_numbering

1.4.1.3 图片提取图片的提取: 需要同时指定文件搜索目录和图片的目录。

--extract-media=filename 

其中filename 是tex源文件转换的目的文件的文件名。建议将要提取的图片都存于同一个文件夹下,图片只支持jpg,png等格式,对pdf不支持,需要先手动转换成jpg。

--resource-path=.;path 

其中. 表示当前工作目录,; 是windows系统的分隔符号(Linux,Unix,macOs用:),path 是图片目录的名字,这句表示将在当前工作目录的path文件下来搜素图片和其他资源。

1.4.1.4 章节编号

通过添加以下配置命令生成各个章节的编号:

--number-sections

1.4.2 参考文献

参考文献是论文写作中必不可少的部分,自动从 .tex 生成参考文献可节约大量格式转化的时间。 通过添加配置命令生成参考文献。

--bibliography=reference.bib

注意:reference应改为你自己的文件名

1.4.2.1 指定参考文献格式

一些情况下需要生成指定格式的参考文献,例如需要 IEEE 或 Springer 的格式。 在 Pandoc 中,参考文献的格式是通过 .csl 文件指定。 在 Zotero Style Repository Zotero Style Repository可以下载到所需的 .csl 文件,如ieee.csl。将下载的 .csl 文件放置到与*.tex* 文件的同级目录下。使用命令指定格式:

--csl ieee.csl 

此外,pandoc 生成指定格式的参考文献需要使用执行器,网络上很多教程推荐使用 --filter pandoc-citeproc这个命令。但新版本的 Pandoc 已经弃用了这个命令,而改为直接使用:

--citeproc

由此完整的生成指定格式的参考文献命令为:

--citeproc --ieee.csl

1.4.2.2 制定章节名称

上面命名只能生成参考文献列表,但不能生成参考文献的章节名。使用如下命令可以自定义参考文献的章节名:

-M reference-section-title=Reference

其中 Reference 为自定义的章节名。

1.5 完整命令

学术论文中最常用的 .tex 文件转 .docx 命令为:

pandoc input.tex  --filter pandoc-crossref --extract-media=output --resource-path=.;path --citeproc --csl ieee.csl  --bibliography=reference.bib -M reference-section-title=Reference  -M autoEqnLabels  -t docx+native_numbering --number-sections -o output.docx

1.6.1. 参考文献无法生成

在确保命令使用正确下从以下方面检查:

reference.bib 是否和要转换的 .tex 文件在同一目录下。
–filter pandoc-crossref 是否紧跟在 pandoc input.tex 后面。

1.6.2. docx 文件不更新

.tex 文件更新,但生成的*.docx* 文件并没有更新。

解决方法:

tex 文件更新后,需要正确编译后才能使用 Pandoc 成功转化为 .docx.

6.3. 部分LaTeX命令不能转换

1.\rm 换成 \mathrm
2.\begin{flalign} ··· \end{flalign}不能识别

公式批量转换

2.1 引言

LaTeX转的docx 里面的公式是WPS自带的公式编辑器Cambria Math格式,但是毕业论文要求的是Times New Roman格式,如果一个一个改非常麻烦,但是新版本的Mythtype给我们提供了批量改公式格式的办法,可以一键解决该问题。

参考

https://zhuanlan.zhihu.com/p/455713759
https://blog.csdn.net/qq_27464321/article/details/88853270

  • 3
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 使用pandocLaTeX转换Word可以按照以下步骤进行: 1. 安装pandocLaTeX:在命令行中输入以下命令进行安装: ``` sudo apt-get install pandoc sudo apt-get install texlive-full ``` 2. 将LaTeX文件转换为docx文件:在命令行中输入以下命令: ``` pandoc -s input.tex -o output.docx ``` 其中,input.tex是要转换LaTeX文件名,output.docx是输出的Word文件名。 3. 转换完成后,可以在输出的Word文件中查看转换结果。 需要注意的是,pandoc转换LaTeXWord时可能会出现一些格式上的差异,需要手动调整。 ### 回答2: Pandoc是一个强大的文本转换工具。它可以轻松将各种格式的文件转换成其他格式的文件,如Markdown转换成HTML,LaTeX转换成PDF,以及本题的重点:将LaTeX文件转换Word文件。 要将LaTeX文件转换Word文件,您需要首先安装PandocPandoc可在Windows、Mac和Linux等不同的系统中运行。您可以通过Pandoc的官方网站 https://pandoc.org/ 下载并安装Pandoc。 安装完Pandoc后,打开终端命令行界面或者PowerShell窗口。进入要转换LaTeX文件所在的目录,输入以下命令开始转换: ``` pandoc example.tex -o example.docx ``` 其中,“example”表示您的LaTeX文件名,.tex是LaTeX的文件格式后缀名,“-o”表示输出,后面接着的“example.docx”则是输出的Word文件名,.docx是Word的文件格式后缀名。执行完该指令,系统会自动将LaTeX文件转换Word文件,并将其保存在相同的文件夹下。 请注意,转换后的Word文件可能与原始LaTeX文件略有不同。这是因为不同的格式在不同的系统中渲染效果可能有所不同。如果您希望得到更好的渲染效果,可以考虑调整样式和格式。 总的来说,Pandoc是一个十分灵活且易于使用的文本转换工具,可以将各种文本格式转换为其他格式。使用Pandoc转换LaTeXWord,可以方便地将LaTeX文件发布或共享给不熟悉LaTeX的人士。 ### 回答3: Pandoc是一种通用的文档转换工具,它可以将多种格式的文档相互转换。在使用PandocLaTeX转换Word时,需要先安装Pandoc,并确保已经安装了适当的字体和LaTeX环境。 以下是将LaTeX文档转换Word文档的步骤。 第一步:创建一个LaTeX文档 使用任何编辑器创建一个LaTeX文档,以.tex作为扩展名保存。 第二步:使用Pandoc将.tex文件转换为.docx文件 在命令行中输入以下命令: pandoc -f latex -t docx input.tex -o output.docx 其中,input.tex为输入文件名,output.docx为输出文件名。 第三步:在Word中打开转换后的文档 使用Microsoft Word或其他适当的软件打开转换后的文档。在打开文档时,可能需要安装一些缺失的字体或下载一些插件。 第四步:编辑和格式转换后的文档 根据需要对转换后的文档进行编辑和格式化。注意,转换后的文档可能需要进行一些手动调整,以确保格式正确。 总结: 使用PandocLaTeX转换Word是一种方便的方式,可以帮助用户快速将LaTeX文件转换Word文件。但是,由于LaTeXWord有一些不同之处,因此转换后的文件可能需要进行一些手动调整才能满足用户的需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值