在此处的文档中,.docx未作为兼容输入列出:
Pandoc是Haskell库,用于从一种标记格式转换为另一种标记格式,并且是使用该库的命令行工具。它可以读取markdown以及Textile,reStructuredText,HTML,LaTeX,MediaWiki标记,Haddock标记,OPML和DocBook(的子集);它可以编写
纯文本,markdown,reStructuredText,XHTML,HTML 5,LaTeX(包括投影仪幻灯片),ConTeXt,RTF,OPML,DocBook,OpenDocument,ODT,Word docx,GNU Texinfo,MediaWiki标记,EPUB(v2或v3) ),FictionBook2,Textile,groff手册页,Emacs Org-Mode,AsciiDoc和Slidy,Slideous,DZSlides,reveal.js或S5 HTML幻灯片。它还可以在安装LaTeX的系统上产生PDF输出。
尝试别的东西,像LibreOffice的 -它可以做的docx,aslong因为你不介意的几个格式错误。
编辑:
现在的说明说Pandoc现在似乎支持从Word DOCX(以及DocBook和其他一些格式)中进行读取:
Pandoc是Haskell库,用于从一种标记格式转换为另一种标记格式,并且是使用该库的命令行工具。它可以读取markdown和(子集)Textile,reStructuredText,HTML,LaTeX,MediaWiki标记,TWiki标记,Haddock标记,OPML,Emacs Org-mode,DocBook,txt2tags,EPUB和Word docx;它可以写纯文本,降价,reStructuredText,XHTML,HTML 5,LaTeX(包括投影仪幻灯片放映),ConTeXt,RTF,OPML,DocBook,OpenDocument,ODT,Word docx,GNU Texinfo,MediaWiki标记,DokuWiki标记,Haddock标记,EPUB(v2或v3),FictionBook2,Textile,groff手册页,Emacs Org-Mode,AsciiDoc,InDesign ICML和Slidy,Slideous,DZSlides,reveal.js或S5 HTML幻灯片。它还可以在安装LaTeX的系统上产生PDF输出。
正如@evilsoup建议的那样,这可能有效:
cd /DIRECTORY/WITH/FILE/IN && libreoffice --headless --convert-to html 'FILE.docx' && pandoc 'FILE.html' -o 'FILE.pdf'
是的,您可以将libreoffice命令与一起使用--outdir,但是html输出并不总是这样。
我进行了此快速测试,除了因文档中的gif图像而使Pandoc崩溃之外,它似乎还可以工作