在前面一期文章 使用Pandas、Jinja和WeasyPrint制作pdf报告 中我分享了如何使用HTML模板来创建pdf报告的方法。
虽然pdf很不错,但更多的人实际上在用微软的WORD来操作文档。实际上对于用户来说,创建所需的模板会更加简单,该模板支持Word中所需的所有自定义格式,而不是尝试使用HTML + CSS。幸运的是,有一个库支持在python中进行MS Word 邮件合并。这种方法的优点是可以在任何系统上运行 - 即使没有安装Word。
背景
使所有这一切成为可能的包叫做 docx-mailmerge。它是一个成熟的包,可以解析MS Word docx文件,找到 合并字段 并将您需要的任何值填充给它们。该包还支持一些辅助函数,用于填充表并生成具有多个分页符的单个文件。
我知道标准的Word方法是将此进程称为 mailmerge ,但本文中的这个 “mailmerge” 可以是一个有用的模板系统,可以用于更复杂的解决方案,而不仅仅是填充文档中的 名称和地址。
安装
docx-mailmerge 需要依赖 lxml ,所以需要先安装lxml,再安装 docx-mailmerge
pip install lxml
pip install docx-mailmerge
Word合并字段
为了使docx-mailmerge正常工作,您需要创建标准Word文档,并定义适当的 合并字段 。以下示例适用于Word 2016.其他版本的Word应该类似。实际上花了我一段时间来弄清楚这个过程,但是一旦你做了几次,这很简单。
启动Word并创建基本文档结构。然后将光标放在应插