1.在命令行执行libreoffice --version,检查是否已经安装LibreOffice。
# Linux 下的安装方法
# 下载并解压缩安装包
# 1.Linux系统下的安装包请到下载页面获取。有两种打包方式:适用于 Debian/Ubuntu 的 ".deb" 包,以及适用于 Fedora/SUSE/Mandriva 的 ".rpm" 包。请选择适合您的操作系统的类型。
# 2.安装包分为“主安装程序”,“已翻译的语言包”,以及“离线帮助”。若要使用中文界面,您必须同时下载中文语言包。比如,您将安装包下载并解压缩到您用户主目录的”下载“目录。
# 安装
# Debian/Ubuntu系统 (.deb包)
# 1.切换到安装包所在的目录
$ cd ~/下载/
# 2.安装主安装程序的所有deb包
$ sudo dpkg -i ./LibreOffice_X.Y.Z_Linux_x86_deb/DEBS/*.deb
# 3.安装中文语言包中的所有deb包 */
$ sudo dpkg -i ./LibreOffice_4.x.x_Linux_x86_deb_langpack_zh-CN/DEBS/*.deb
# 4.安装中文离线帮助文件中的所有deb包
$ sudo dpkg -i ./LibreOffice_4.x.x_Linux_x86_deb_helppack_zh-CN/DEBS/*.deb
# Fedora/SUSE/Mandriva系统 (.rpm包)
# 1.切换到安装包所在的目录
$ cd ~/下载/
# 2.安装主安装程序的所有rpm包
$ sudo yum install ./LibreOffice_4.x.x_Linux_x86_rpm/RPMS/*.rpm
# 3.安装中文语言包中的所有rpm包
$ sudo yum install ./LibreOffice_4.x.x_Linux_x86_rpm_langpack_zh-CN/RPMS/*.rpm
# 4.安装中文离线帮助文件中的所有rpm包
$ sudo yum install ./LibreOffice_4.x.x_Linux_x86_rpm_helppack_zh-CN/RPMS/*.rpm
# 卸载
# Debian/Ubuntu系统 (.deb包)
# 移除所有类似libreoffice4.x-*的包。--purge表示卸载的同时移除所有相关的配置文件
$ sudo apt-get remove --purge libreoffice4.x-*
# Fedora/SUSE/Mandriva系统 (.rpm包)
# 移除所有类似libreoffice4.x-*的包
$ sudo yum remove libreoffice4.x-*
2.安装完毕后,使用以下命令,对待转格式的文档进行格式转换。
# 将.doc格式文档转为txt格式
libreoffice --headless --convert-to txt path-to-your-doc.doc
# 同样可以指定转换后的文件输出路径,也可以批量地将doc/docx/wps文件传给LibreOffice接口
libreoffice --headless --convert-to html --outdir /your/output/dir /your/doc_docx_wps/files/*.{
dosx,doc,wps}
3.使用python脚本执行格式转换
import os
os.system("libreoffice --headless --convert-to txt path-to-your-doc.doc")
4.使用Python执行多进程启动转换
import subprocess
import os, glob
from multiprocessing.dummy import Pool
def worker(fname, dstdir=os.path.expanduser("~")):
subprocess.call(["libreoffice", "--headless", "--convert-to", "pdf", fname], cwd=dstdir)
pool = Po