Word 转 PDF
首先,我们需要安装一个比较小众的库docx2pdf
,兼容Mac和Windows系统用户。
pip install docx2pdf
那我们开始见识一下docx2pdf
多厉害吧!
from docx2pdf import convert
convert('input.docx', 'output.pdf')
import os
import glob
from pathlib import Path
path = os.getcwd() + '/'
p = Path(path)
FileList = list(p.glob('**/*.docx'))
for file in FileList:
convert(file, f'{file}.pdf')
Excel 转 PDF
通常使用的工具包括openpyxl
或pandas
,但这里我们使用专门处理PDF的库fpdf
。
import pandas as pd
import numpy as np
df_1 = pd.DataFrame(np.random.randn(10, 2), columns=list('AB'))
from fpdf import FPDF
pdf = FPDF()
pdf.add_page()
pdf.set_xy(0, 0)
pdf.set_font('arial', 'B', 14)
pdf.cell(60)
pdf.cell(70, 10, 'Excel to PDF', 0, 2, 'C')
pdf.cell(-40)
pdf.cell(50, 10, 'Index Column', 1, 0, 'C')
pdf.cell(40, 10, 'A', 1, 0, 'C')
pdf.cell(40, 10, 'B', 1, 2, 'C')
pdf.cell(-90)
pdf.set_font('arial', '', 12)
for i in range(0, len(df_1)):
col_ind = str(i)
col_a = str(df_1.A.iloc[i])
col_b = str(df_1.B.iloc[i])
pdf.cell(50, 10, '%s' % (col_ind), 1, 0, 'C')
pdf.cell(40, 10, '%s' % (col_a), 0, 0, 'C')
pdf.cell(40, 10, '%s' % (col_b), 0, 2, 'C')
pdf.cell(-90)
pdf.output('Excel2PDF.pdf', 'F')
PPT 转 PDF
ppt2pdf目前无法在Mac系统上进行实现,故只能针对Windows进行操作,即comtypes
import sys
import os
import comtypes.client
# set path
input_file_path = sys.argv[1]
output_file_path = sys.argv[2]
input_file_path = os.path.abspath(input_file_path)
output_file_path = os.path.abspath(outpath_file_path)
# create pdf
powerpoint = comtypes.client.CreateObject('Powerpoint.Application')
powerpoint.Visible = 1
slides = powerpoint.Presentations.Open(input_file_path)
# save pdf
slides.SaveAs(output_file_path, 32)
slides.Close()
md 转 PDF
可能因为大部分博客都使用markdown格式,所以老外造了很多md2pdf的轮子,例如md2pdf
、markdown2pdf
、md2pdf-client
等。这里我们使用markdown2pdf3
。
from markdown2pdf3 import *
convert_markdown_to_pdf('test.md') #你的markdown文件路径
import os
import glob
from pathlib import Path
path = os.getcwd() + '/'
p = Path(path) #初始化构造Path对象
FileList=list(p.glob("**/*.md"))
HTML 转 PDF
在这里我们使用pdfkit
,但在安装前需要在wkhtmltopdf中找到对应电脑系统的版本安装下载,方可安装pdfkit
。
pip install pdfkit
import pdfkit
pdfkit.from_url('https://mp.weixin.qq.com/s/Gtylgjz-ZmKyQOFoEnOm3g', 'out.pdf')