之前写的用aspose.word转pdf,看评论应该有很多人也遇到相似的需求,这里推荐下python版的转pdf方法,感觉效果是非常好的了。推荐用pdfkit,效果好,使用也简单。
在linux下需要安装 wkhtmltopdf.rpm
wget https://downloads.wkhtmltopdf.org/0.12/0.12.5/wkhtmltox-0.12.5-1.centos7.x86_64.rpm
rpm -ivh wkhtmltox-0.12.5-1.centos7.x86_64.rpm
然后将windows本地的字体文件拷贝到centos,否则可能导致都是字体缺失,都是小方块。
windows字体文件在 C 盘:C:\\Windows\\Fonts目录下。
拷贝到/usr/share/fonts/zh_CN,如果没有zh_CN文件夹,就将复制过去的fonts目录重命名为zh_CN。
这是我远程拷贝文件的办法,先用tar命令将文件夹压缩,然后进行远程拷贝,当然ftp工具也可以,只是我这里采用的是scp命令:
# 本地windows,利用git bash终端提供的部分linux命令。
# scp:将本机文件拷贝到远程linux
scp file root@host:/dir
需要指定本地文件和远程文件夹。
# scp:将远程linux文件拷贝到本机
scp root@host:/dir/file /dir
之后解压缩,并将字体更新:
fc-cache -fv
windows下需要安装wkhtmltopdf.exe。
这个wkhtmltopdf是pdfkit的基础组件,wkhtmltopdf利用的是webkit内核来实现转pdf,html模式的文件,或者字符串亦或url都可以转为pdf,但是对其他格式的文档支持貌似没有那么好,在windows下对于doc等文档转pdf,用win32com接口即可。示例代码在我的github --> https://github.com/xiqiuyimeng/to_pdf_demo
装好wkhtmltopdf后,在进行python类库安装,pip install pdfkit。
装好即可运行代码。下面的代码是用flask简单搭建了一个网站,部署在虚拟机中,在主机进行访问。
python实现转pdf 并下载的demo 代码:
from flask import Flask
from flask import send_file
import pdfkit
import os
app = Flask(__name__)
@app.route('/')
def index():
return "hello world"
@app.route('/to_pdf')
def convert():
html_str = "www.baidu.com"
options = {
"encoding": "utf-8",
}
path = os.path.join(os.path.abspath('.'), 'test.pdf')
print("the pdf path is {}".format(path))
# windows中,需要指定下wkhtmltopdf的位置,或者写入环境变量也可
wk_path = "./static/wkhtmltopdf.exe" if os.name is 'nt' else None
config = pdfkit.configuration(wkhtmltopdf=wk_path)
try:
pdfkit.from_url(html_str, path, options=options, configuration=config)
return send_file(path, as_attachment=True)
except Exception as e:
print("出错了: {}".format(e))
return "出错了: {}".format(e)
if __name__ == '__main__':
# 允许别的机器访问
app.run(host='0.0.0.0')
效果如下:
总体来说,对比java用aspose.word生成pdf,和python用pdfkit生成pdf,python的更好一些。