导入第三方库
import os
import pdfkit
下载wkhtmltopdf.exe,并确定绝对路径
path_to_wkhtmltopdf = r'E:\脚本\HTML_to_PDF\wkhtmltopdf\bin\wkhtmltopdf.exe' # wkhtmltopdf.exe绝对路径
读取文件夹中HTML文件
# 读取文件夹中HTML文件
pdf_list=[]
def search_file(dirPath, suffix):
dirs = os.listdir(dirPath)
for currentFile in dirs:
absPath = dirPath + '/' + currentFile
if os.path.isdir(absPath):
search_file(absPath, suffix)
elif currentFile.split('.')[-1] == suffix: # 文件后缀名相同,则打印该文件的绝对路径
pdf_list.append(absPath)
# print(absPath)
if __name__ == "__main__":
dirPath = 'E:\脚本\HTML_to_PDF\xxxxx' # 文件存储绝对路径
suffix = 'html'
search_file(dirPath, suffix)
选择文件HTML file
# 选择文件HTML file
for i in range(len(pdf_list)):
path_to_file = pdf_list[i]
# 替换html后缀
pdf_list[i] = pdf_list[i].replace('.html', '')
# 使用wkhtmltopdf.exe
config = pdfkit.configuration(wkhtmltopdf=path_to_wkhtmltopdf)
# 转换
pdfkit.from_file(path_to_file, output_path=f'{pdf_list[i]}.pdf', configuration=config)
print(f"{pdf_list[i]}已转换")
完成转换并存储
关于多个PDF合并,请移步至合并链接
http://t.csdn.cn/lGhTa