本文章实现不同环境,word文档转pdf文档
文章目录
一、linux环境
1、环境安装
去网站下载最新版libreoffice安装包
https://mirrors.cloud.tencent.com/libreoffice/libreoffice/stable/
以下几个版本都可以
deb是ubuntu,mac是苹果,rpm是centos
选择LibreOffice_6.4.4_Linux_x86-64_rpm.tar.gz
解压:
tar -zxvf LibreOffice_6.4.4_Linux_x86-64_rpm.tar.gz
安装:
cd LibreOffice_6.4.4.2_Linux_x86-64_rpm/RPMS/
yum localinstall *.rpm
2、测试安装是否成功:
libreoffice6.4 --version
命令转格式测试:
libreoffice6.4 --convert-to pdf:writer_pdf_Export ./123.docx --outdir ./
问题汇总:
1、如果libreoffice出现cpu100%并且长时间无响应
2、word转pdf之后,中文乱码
解决方法(注:方法1基本就解决了上述两个问题):
1、linux系统缺少中文字体导致
具体操作:
建一个chinese目录,找到windows的C:\Windows\Fonts的部分字体,msyh.ttf,msyhbd.ttf,simsun.ttc,simkai.ttf,simhei.ttf,simfang.ttf,把字体放到chinese目录里。并把此目录移动到linux中的/usr/share/fonts/下
chmod -R 755 /usr/share/fonts/chinese //赋予权限
fc-list | grep chinese // 可以查看到已安装新增的字体了
2、禁用libreoffice屏幕显示(不一定管用)
# 找到安装目录sofficerc文件
vim /etc/libreoffice/sofficerc
Logo=1 改为 Logo=0
二、windows环境
1、环境安装
pip install pypiwin32
测试可以用集成代码
三、windows和linux集成代码
import os
import platform
import subprocess
from win32com.client import Dispatch
def doc2pdf_windows(input_file):
word = Dispatch('Word.Application')
doc = word.Documents.Open(input_file)
doc.SaveAs(input_file.replace(".doc", ".pdf"), FileFormat=17)
doc.Close()
word.Quit()
def doc2pdf_linux(docFile):
"""
convert a doc/docx document to pdf format (linux only, requires libreoffice)
:param doc: path to document
"""
file_path = os.path.dirname(os.path.realpath(docFile))
cmd = 'libreoffice6.4 --convert-to pdf:wirter_pdf_Export'.split() + [docFile] + ['--outdir'] + [file_path]
p = subprocess.Popen(cmd, stderr=subprocess.PIPE, stdout=subprocess.PIPE)
p.wait(timeout=30)
stdout, stderr = p.communicate()
if stderr:
raise subprocess.SubprocessError(stderr)
if __name__ == '__main__':
file = 'D:\\work\\code\\test.doc'
sys = platform.system()
if sys == "Windows":
doc2pdf_windows(file)
elif sys == "Linux":
doc2pdf_linux(file)