pandoc.exe
是 Pandoc 文档转换工具的可执行文件。Pandoc 是一个多功能的文档转换器,支持将多种标记和文档格式互相转换。它广泛应用于文本处理、文档生成、学术写作、网站构建等领域。以下是一些使用 pandoc.exe
的常见案例:
基本使用案例
-
Markdown 转 HTML
pandoc input.md -o output.html
将 Markdown 文件
input.md
转换为 HTML 文件output.html
。 -
HTML 转 Markdown
pandoc input.html -o output.md
将 HTML 文件
input.html
转换为 Markdown 文件output.md
。 -
Markdown 转 PDF
pandoc input.md -o output.pdf
将 Markdown 文件
input.md
转换为 PDF 文件output.pdf
。需要注意,Pandoc 生成 PDF 文件时通常需要安装 LaTeX。 -
Markdown 转 Word (DOCX)
pandoc input.md -o output.docx
将 Markdown 文件
input.md
转换为 Word 文档output.docx
。 -
Markdown 转 EPUB
pandoc input.md -o output.epub
将 Markdown 文件
input.md
转换为 EPUB 文件output.epub
,适用于电子书制作。
高级使用案例
-
多文件合并
pandoc chapter1.md chapter2.md chapter3.md -o book.pdf
将多个 Markdown 文件合并为一个 PDF 文件
book.pdf
。 -
使用模板生成文档
pandoc input.md -o output.pdf --template=mytemplate.latex
使用自定义的 LaTeX 模板
mytemplate.latex
生成 PDF 文件output.pdf
。 -
自定义 CSS 样式
pandoc input.md -o output.html --css=style.css
使用自定义的 CSS 文件
style.css
生成 HTML 文件output.html
。 -
包含元数据
pandoc input.md --metadata title="我的文档" --metadata author="张三" --metadata date="2025-01-11" -o output.pdf
在生成 PDF 文件时包含元数据信息。
-
使用过滤器(Filters)
pandoc input.md -o output.html --filter=pandoc-crossref
使用 Pandoc 的过滤器插件
pandoc-crossref
来处理交叉引用。 -
生成目录
pandoc input.md -o output.pdf --toc
生成带有目录的 PDF 文件。
-
指定输出文件编码
pandoc input.md -o output.html --from=utf8 --to=utf8
指定输入和输出文件的编码为 UTF-8。
-
处理引用和参考文献
pandoc input.md --bibliography=references.bib -o output.pdf
使用 BibTeX 文件
references.bib
处理引用和参考文献。 -
生成多种输出格式
pandoc input.md -o output.html -o output.pdf -o output.epub
同时生成 HTML、PDF 和 EPUB 文件。
-
从 LaTeX 转换为 Markdown
pandoc input.tex -o output.md
将 LaTeX 文件
input.tex
转换为 Markdown 文件output.md
。 -
从 Docx 转换为 Markdown
pandoc input.docx -o output.md
将 Word 文档
input.docx
转换为 Markdown 文件output.md
。 -
从 ODT 转换为 Markdown
pandoc input.odt -o output.md
将 OpenDocument 文档
input.odt
转换为 Markdown 文件output.md
。 -
使用脚本批量转换文件
for file in *.md; do pandoc "$file" -o "${file%.md}.pdf" done
使用 Bash 脚本批量将所有 Markdown 文件转换为 PDF 文件。
-
生成幻灯片
pandoc input.md -t revealjs -o output.html --slide-level=2
将 Markdown 文件
input.md
转换为使用 Reveal.js 框架的幻灯片 HTML 文件output.html
。 -
使用参考文档
pandoc input.md -o output.docx --reference-doc=custom-reference.docx
使用自定义的参考文档
custom-reference.docx
来生成 Word 文档output.docx
。 -
处理多语言文档
pandoc input.md -o output.docx --toc --metadata lang=zh-CN
生成带有目录和中文语言设置的 Word 文档
output.docx
。 -
嵌入图像
pandoc input.md -o output.html --embed-resources --self-contained
生成自包含的 HTML 文件
output.html
,嵌入所有资源(如图像)。
其他使用场景
-
集成到 CI/CD 管道
pandoc documentation.md -o documentation.pdf
在持续集成/持续部署管道中使用 Pandoc 自动生成文档。
-
在线文档生成
在网站后端使用 Pandoc 将 Markdown 转换为 HTML,以便在线展示。 -
书籍和报告生成
使用 Pandoc 将多个章节文件合并并生成书籍或报告的多种格式(如 PDF、EPUB)。 -
学术论文格式转换
将 LaTeX 格式的学术论文转换为 Word 格式,以便提交给期刊或会议。 -
文档自动化
使用 Pandoc 编写脚本,自动化将多种格式的文档转换为统一格式,简化文档管理。
下载地址:https://objects.githubusercontent.com/github-production-release-asset-2e65be/571770/b8b87f98-137e-4734-931e-19067b3470db?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=releaseassetproduction%2F20250111%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20250111T061838Z&X-Amz-Expires=300&X-Amz-Signature=bd4f41068bf4c571c61d4bf43ece2fbbe293fe883737bc491d92e3418c58b5f7&X-Amz-SignedHeaders=host&response-content-disposition=attachment%3B%20filename%3Dpandoc-3.6.1-windows-x86_64.msi&response-content-type=application%2Foctet-stream
https://objects.githubusercontent.com/github-production-release-asset-2e65be/571770/c916ebe0-177d-4cad-b958-bc8e1e636d44?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=releaseassetproduction%2F20250111%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20250111T061907Z&X-Amz-Expires=300&X-Amz-Signature=b4460c474f0a5c8f9777c32aca53d3b33b51a1ab5e0e9753966baac1701eef7f&X-Amz-SignedHeaders=host&response-content-disposition=attachment%3B%20filename%3Dpandoc-3.6.1-windows-x86_64.zip&response-content-type=application%2Foctet-stream