Python Word 转html

Python Word 转html

工作中偶尔用到word转html,实际需求更多是要转表单形式进行交互,找了下网上也没找到合适。

除了在线转,一般就PyDocx和Mammoth,这两个库。用来转换静态html,只做展示也还行。两个库对图片都是通过base64进行编码。

首先pip两个库。

pip install pydocx -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install mammoth -i https://pypi.tuna.tsinghua.edu.cn/simple
from pydocx import PyDocX
import mammoth

#PyDocx转换
html = PyDocX.to_html("test.docx")
f = open("test3.html", "w", encoding='utf-8')
f.write(html)
f.close()

#Mammoth
style_map = """
p[style-name='Section Title'] => h1:fresh
p[style-name='Subsection Title'] => h2:fresh
"""
with open("test.docx", "rb") as f:
    res = mammoth.convert_to_html(f, style_map=style_map)
    html2 = res.value
h = open("test4.html", "w", encoding='utf-8')
h.write(html2)
h.close()

Mammoth 可以自定义样式映射。参考github

PyDocx更多是对word文档的操作,具体的一些细节可以参考这篇文章:参考文章

原文中word的样式如图:

在这里插入图片描述

PyDocx转换:

在这里插入图片描述

Mammoth转换

在这里插入图片描述

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值