pandoc 可转换的格式_像专业人士一样使用Pandoc转换文档

pandoc 可转换的格式

有没有人给您发送过不适合您的格式的文档? 也许您无权访问用于创建文档的应用程序,或者您不需要太多文档,而只需要其中的内容,或者只是完全不喜欢该格式。 没有不喜欢文件格式的错误原因。 如果这不是您的首选格式,无论您觉得使用起来很麻烦还是只是不喜欢其元数据的组织方式,那么就足够了您进行转换。 但是,很少有很好的理由手动转换文档,因此Pandoc可以确保您不必这样做。

安装pandoc

如果您使用的是Linux,则可以从软件存储库安装pandoc

在Fedora或CentOS或类似产品上:

 $  sudo dnf install pandoc 

在Ubuntu,Elementary,Debian或类似系统上:

 $  apt install pandoc 

如果您使用的是Windows或macOS,则可以使用第三方安装程序。 对于Windows,有Chocolatey ,在macOS上,您可以使用MacPortsHomebrew

安装完成后,您可以通过简单的版本检查进行验证:


   
   
$ pandoc --version
pandoc x.y.z
[ ... ]

Pandoc基础

最基本的说, pandoc命令是最容易使用的命令之一。 您在终端中键入pandoc ,为其提供要转换的文件,然后键入--output和所需输出文件的名称。 Pandoc通常可以从其文件扩展名中自动检测这两种格式,然后将其从一种转换为另一种。

这是一个将.docx文件转换为.odt的简单示例:

 $  pandoc ~ / Documents / example.docx --output ~ / Documents / example.odt 

如果您不习惯使用终端,请记住,在大多数现代终端应用程序中,您可以将文件从桌面拖放到终端中,以将其转换为计算机可以理解的完整路径。

您可以指定几乎可以想到的任何格式:

 $  pandoc ~ / Documents / example.docx --output ~ / public_html / example.html 

没错:Pandoc使您能够从一种单一的源格式输出许多不同的格式。

查找您的源格式

可以自由选择最喜欢的工具。

如果您了解基本HTML并想在其中编写所有内容,请抓住一个好HTML编辑器并开始编写。 Pandoc会将其转换为您的老板,客户或教授所需的任何内容。 或者,您可能更喜欢Docbook,LaTeX,CommonMark,Org模式,或者只是普通的LibreOffice .odt。 对Pandoc没关系。 找到您喜欢的格式,这种格式可以让您专注于完成工作,而让Pandoc承担艰巨的任务。

Pandoc选项

看起来似乎不对,但现在您知道了Pandoc的所有基础知识。 这是一个简单的命令,可以从一种文档格式转换为另一种文档格式。 如果您仅需要这些,那么您已经完成了本文。

但是,Pandoc是一个大型应用程序,它可以处理的每种格式都有很多选项。 如果您已经是Pandoc用户,或者想更深入地研究Pandoc可以做什么,则需要查看其命令选项。

从和到

你需要知道的第一个选项是--from--to标志。 这明确地告诉Pandoc什么格式, 过程,你可以使用它们的时候Pandoc的输出不符合您的期望,或当你需要一个可以共享相同的扩展格式之间进行区分。

例如,CommonMark,Markdown,markdown_phpextra,markdown_strict和markdown_github都可以使用.md或.txt扩展名。 HTML和HTML5都使用.html扩展名,而EPUB版本2和3都使用.epub扩展名。 确切指定所需的格式转换可确保Pandoc为您提供预期的输出:

 $  pandoc --from docx example.docx --to commonmark example.md 

目录

它因格式而异,但是Pandoc并不总是提供目录。 --table-of-contents选项,或简称为--toc ,确保带有章节分隔符的文档(或诸如HTML中的h2,Markdown中的##等子标题标记)前面带有章节列表。

如果您有包含各小节的章节以及这些小节中的章节,则可以使用--toc-depth设置每章下列出的副标题数量。

电子书电子书

Epub是一种开放标准,是最流行的电子书格式之一。 您可以从LibreOffice,Caliber,Scribus等应用程序生成它们,也可以使用Pandoc转换为Epub。 如果您了解一点CSS,可以在运行Pandoc时提供样式表来轻松设置Epub的样式:

 $  pandoc --epub-stylesheet my.css foo.md --output foo.epub 

此外,您可以设置自己的元数据,以便Epub阅读者知道如何对书籍进行排序。 为此,请在任何文本编辑器中创建一个简单的XML文件:


   
   
<dc:rights > Creative Commons </dc:rights >
<dc:creator > Seth Kenlon </dc:creator >
<dc:title > Be a Pandoc Pro </dc:title >

保存文件,然后在转换时将其用作元数据源:


   
   
$ pandoc --epub-stylesheet my.css \
--epub-cover-image cover_front.jpg \
--epub-metadata data.xml \
foo.md --output foo.epub

PDF选项

大多数POSIX系统都具有“打印”为PDF的功能。 这使生成PDF变得容易,但有时会导致一些奇怪现象,例如不正确的元数据。 如果您购买独立的 RPG电子书和RPG电子书,那么肯定会遇到带有专业标题的“ Word文档.docx”嵌入式PDF或带有以蓝色显示的超链接的PDF(无论它们的样式如何)(通常甚至都不活跃​​)。

控制PDF呈现方式的一种方法是使用Pandoc。 使用Pandoc,您可以在源文档中使用LaTeX命令来影响PDF输出,还可以添加自己的元数据键和值:

 $  pandoc --metadata =title: "My Professional Report" foo.odt --output foo.pdf 

下载Pandoc备忘单

Pandoc为需要转换文档格式的任何人提供了强大的支持。 即使无法完全满足您的需求,它也始终能够使您更加接近所需。 编写内容时使用开放和标准化的格式,请放心Pandoc可以转换为您需要的任何格式。 您使用Pandoc的次数越多,您肯定会发现更多。

为了帮助您进行探索,我们开发了更新的Pandoc备忘单作为方便参考。 该备忘单几乎无法涵盖Pandoc的所有功能,但它在通用上下文中提供了一些通用命令,并提供了您可以期望的一般工作流程的感觉。

翻译自: https://opensource.com/article/20/5/pandoc-cheat-sheet

pandoc 可转换的格式

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值