python word 合并单元格_在word文档选项卡中检测合并单元格

一点背景

我有一个软件规范,我需要以表格的形式解析需求。它们的格式也不总是相同的。我继承了一个python脚本,它使用win32com解析word文档,然后openpyxl将需求导出到excel文件,然后将其上载到HP ALM。在

问题

使用python(或其他可以与python通信的语言),我正在寻找一种相对简单、简单的方法来区分合并单元格和空单元格(这两种都出现在microsoftword文档中)(2010.docx)。在

说明

到目前为止,我已经为这个问题寻找了几个星期的解决方案,但是我还没有找到一个令人满意的答案。在

在stackoverflow上有一些问题here和{a2}。第二个问题是,有一个字段可以告诉您表中是否有合并单元格,这是一个起点,但这还不够,因为表可能是一个跨越多页的超长表。在

尝试解决方案

尝试1.)我的第一个想法是win32com肯定支持检测表中合并的单元格。所以我找了又找能帮我解决这个问题的方法。我发现唯一有效的方法就是检查合并后的单元格是否为空,而上一个单元格是否为空。但是,我无法判断该单元格是否为真正的空单元格或合并单元格。在

尝试2.)我的下一个想法是使用COM和win32api将该功能添加到win32com。但是,我发现COM是相当笨拙的,过时了,而且超级无证,很难使用。win32api也是如此。基本上,我发现这是比它值得做的更多的努力。在

然后我开始寻找win32com的替代库,比如docx for python。这里的问题是,我在非管理员计算机上工作,这严重限制了我下载第三方库的能力。因此,我还没有尝试过这个选项,因为我在获得win32com和openpyxl时就沿着这条路走了。在

尝试4.)我最新也是可能的最后一次尝试是将worddocx文档转换成一个可以轻松解析的XML文件。但是,我不知道XML,也不知道word用于XML的标准格式。在

我现在正在寻找一种最快速、最干净的方法来实现这一点,而无需重写库,也无需从头开始我的1000行脚本。(顺便说一下,它上面有一个显示图形用户界面,所以它很长)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值