python之xhtml2pdf: HTML转PDF工具示例详解

最新推荐文章于 2025-03-30 09:17:27 发布

然然学长

最新推荐文章于 2025-03-30 09:17:27 发布

阅读量4.9k

点赞数 2

文章标签： python 开发语言 xhtml2pdf

本文链接：https://blog.csdn.net/naer_chongya/article/details/131771930

版权

本文介绍了Python中一款强大的HTML转PDF工具XHTML2PDF，并提供了详细的示例说明，帮助读者快速上手使用该工具。通过本文，读者将了解如何安装和配置XHTML2PDF，以及如何使用该工具将HTML文件转换为高质量的PDF文档。

在现代的应用程序开发中，我们经常需要将HTML内容转换为PDF文档。这种需求在打印电子商务收据、生成报告、导出电子书等场景中非常常见。Python中有众多强大的工具库可用于实现HTML到PDF的转换，而XHTML2PDF就是其中一款非常流行的选择。本文将详细介绍XHTML2PDF的使用方法，并提供示例代码帮助读者快速上手。

1.安装XHTML2PDF库

在使用XHTML2PDF之前，我们首先需要安装这个库。可以通过使用pip，在命令行中执行以下命令来安装：

$ pip install xhtml2pdf

2.导入XHTML2PDF库

安装完成后，我们需要在Python脚本中导入XHTML2PDF库，以便使用其中的功能。导入的语法如下：

from xhtml2pdf import pisa

3.转换HTML到PDF

接下来，我们将学习如何使用XHTML2PDF将HTML文件转换为PDF文档。以下是一个简单的示例代码：

from io import BytesIO
from xhtml2pdf import pisa

def convert_html_to_pdf(html_string, output_path):
    pdf_file = open(output_path, "wb")
    pisa_status = pisa.CreatePDF(html_string, dest=pdf_file)
    pdf_file.close()

    if pisa_status.err:
        print(f"Error occurred while converting HTML to PDF: {pisa_status.err}")
    else:
        print("HTML converted to PDF successfully!")

# 读取HTML文件内容
with open("input.html", "r") as file:
    html_content = file.read()

# 调用转换函数
convert_html_to_pdf(html_content, "output.pdf")

以上代码中，我们定义了一个convert_html_to_pdf函数，该函数接受两个参数：HTML文件的内容以及输出的PDF文件路径。函数中，我们先打开一个二进制写入模式的PDF文件，然后通过调用pisa.CreatePDF函数实现HTML到PDF的转换。转换完成后，关闭文件。

4.处理CSS样式

XHTML2PDF库支持CSS样式的解析和渲染，这使得我们可以轻松地将HTML文件中的样式应用到生成的PDF文档中。以下是一个示例代码：

def convert_html_to_pdf(html_string, output_path):
    pdf_file = open(output_path, "wb")
    pisa_status = pisa.CreatePDF(html_string, dest=pdf_file, encoding="UTF-8",
                                css=open("style.css", "r").read())

    ...

# 调用转换函数
convert_html_to_pdf(html_content, "output.pdf")

通过将CSS文件的内容作为参数传递给pisa.CreatePDF函数的css参数，我们可以将样式应用到PDF文档中。在上面的示例中，我们将style.css文件的内容作为CSS样式传递给函数。

5.处理图像和字体

XHTML2PDF库还支持将图像和字体添加到生成的PDF文档中。以下是一个示例代码：

def convert_html_to_pdf(html_string, output_path):
    pdf_file = open(output_path, "wb")
    pisa_status = pisa.CreatePDF(html_string, dest=pdf_file, encoding="UTF-8",
                                css=open("style.css", "r").read(),
                                images_path="images/",
                                fonts_path="fonts/")

    ...

# 调用转换函数
convert_html_to_pdf(html_content, "output.pdf")

上面的示例代码中，我们通过传递images_path参数和fonts_path参数给pisa.CreatePDF函数，指定了图像文件和字体文件的路径。在这个例子中，我们假设图像文件存储在"images/"目录下，字体文件存储在"fonts/"目录下。通过这种方式，可以方便地在生成的PDF文档中插入图像和使用自定义字体。

6.错误处理

在使用XHTML2PDF时，我们需要注意错误处理。XHTML2PDF库提供了一个PMLCreationError类，用于表示HTML转换为PDF时可能发生的错误。以下是一个示例代码：

def convert_html_to_pdf(html_string, output_path):
    pdf_file = open(output_path, "wb")
    pisa_status = pisa.CreatePDF(html_string, dest=pdf_file)

    if pisa_status.err:
        print(f"Error occurred while converting HTML to PDF: {pisa_status.err}")
    else:
        print("HTML converted to PDF successfully!")

# 调用转换函数
convert_html_to_pdf(html_content, "output.pdf")

在上面的代码中，我们检查pisa.CreatePDF函数的返回值中的err属性。如果err属性不为空，表示转换过程中发生了错误，我们可以打印错误消息进行调试。

结论：

通过本文，我们详细介绍了XHTML2PDF库及其使用方法，以及如何将HTML文件转换为高质量的PDF文档。我们了解了安装和配置XHTML2PDF的步骤，并提供了示例代码帮助读者快速上手。同时，我们还讨论了如何处理CSS样式、插入图像和使用自定义字体。希望本文能够帮助读者在Python中使用XHTML2PDF进行HTML到PDF的转换。