【工具使用系列】文件格式转换工具Pandoc

基本信息列表

  • 稳定版本:1.19.2.1(发布时间:20170131)
  • 源代码库:github.com/jgm/pandoc
  • 编程语言:Haskell
  • 操作系统:FreeBSD, NetBSD, Linux, Windows, Mac OS X
  • 软件类型:标记语言转换工具
  • 许可协议:GNU GPL
  • 软件网站:johnmacfarlane.net/pandoc/

基本功能列表

Pandoc可读取的源格式Pandoc可生成的目标格式
MarkdownHTML格式:包括XHTML,HTML5及HTML slide
reStructuredText文字处理软件格式:包括docx、odt、OpenDocument XML
textile电子书格式:包括EPUB(第2版及第3版)、FictionBook2
HTML技术文档格式:包括DocBook、GNU TexInfo、Groff manpages、Haddock
DocBook页面布局格式:InDesign ICML
LaTeX大纲处理标记语言格式:OPML
MediaWiki标记语言TeX格式:包括LaTeX、ConTeXt、LaTeX Beamer
OPMLPDF格式:需要LaTeX支持
Org-Mode轻量级标记语言格式:包括Markdown、reStructuredText、textile、Org-Mode、MediaWiki标记语言、AsciiDoc
Haddock自定义格式:可使用lua自定义转换规则

Pandoc:将文件从一种标记格式转换为另一种标记格式。Pandoc可以在以下格式之间转换:

(←=转换自;→=转换为;↔=转换为和转换)

  • 轻量级标记格式
    ↔ Markdown (包括CommonMark和GitHub方式的 Markdown)
    ↔ reStructuredText
    → AsciiDoc
    ↔ Emacs Org-Mode
    ↔ Emacs Muse
    → Textile
    ← txt2tags

  • HTML格式
    ↔ (X)HTML 4
    ↔ HTML5

  • 电子书
    ↔ EPUB版本2或3
    ↔ FictionBook2

  • 文档格式
    → GNU TexInfo
    ↔ roff man
    → roff ms
    ↔ Haddock markup

  • TeX格式
    ↔ LaTeX
    → ConTeXt

  • XML格式
    ↔ DocBook的版本4或5
    ↔ JATS
    → TEI Simple

  • 交互式笔记本格式
    ↔ Jupyter notebook (ipynb)

  • 字处理器格式
    ↔ Microsoft Word docx
    ↔ OpenOffice/LibreOffice ODT
    → OpenDocument XML
    → Microsoft PowerPoint

  • 页面布局格式
    → InDesign ICML

  • 大纲格式
    ↔ OPML

  • Wiki标记格式
    ↔ MediaWiki markup
    ↔ DokuWiki markup
    ← TikiWiki markup
    ← TWiki markup
    → Vimwiki markup
    → XWiki markup
    → ZimWiki markup

  • 幻灯片放映格式
    → LaTeX Beamer
    → Slidy
    → reveal.js
    → Slideous
    → S5
    → DZSlides

  • 自定义格式
    →可以用lua编写的自定义编写器。

  • PDF
    →通过pdflatex,xelatex,lualatex,pdfroff,wkhtml2pdf,prince,或weasyprint。

Pandoc了解许多有用的markdown语法扩展,包括文档元数据(标题,作者,日期); 脚注; 表; 定义清单; 上标和下标; 删除线; 增强的有序列表(起始编号和编号样式很重要); 运行示例列表; 带语法高亮的分隔代码块; 聪明的引号,短划线和椭圆; HTML块内的markdown; 和内联LaTeX。如果需要严格的markdown兼容性,则可以关闭所有这些扩展。

LaTeX数学(甚至宏)可用于markdown文档。提供了几种不同的HTML渲染数学方法,包括MathJax和MathML的翻译。LaTeX数学被转换(根据输出格式的需要)到unicode,本机Word方程对象,MathML或roff eqn。

Pandoc包含一个强大的系统,用于自动引用和参考书目,使用pandoc-citeproc(源自Andrea Rossato的citeproc-hs)。这意味着你可以写一个类似的引文。

[see @doe99, pp. 33-35; also @smith04, ch. 1]

和pandoc将使用数百种CSL样式(包括脚注样式,数字样式和作者日期样式)中的任何一种将其转换为格式正确的引文,并在文档末尾添加格式正确的参考书目。可以使用许多形式的书目数据库,包括bibtex,RIS,EndNote,ISI,MEDLINE,MODS和JSON citeproc。引文以每种输出格式工作。

有许多方法可以自定义pandoc以满足您的需求,包括模板系统和用于编写过滤器的强大系统。

Pandoc包括一个Haskell库和一个独立的命令行程序。该库包含针对每种输入和输出格式的单独模块,因此添加新的输入或输出格式只需添加新模块。

Pandoc是免费软件,根据GPL发布。版权所有2006-2019 John MacFarlane。


需要尝试,请访问:https://pandoc.org/try/
更多资料,请阅读:https://pandoc.org/MANUAL.pdf

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值