python同时读取表格和段落,如何使用Python迭代读取word中的段落、表格和图片

到目前为止,我已经找到了一种在word中按顺序和迭代方式阅读段落和表格的方法,但我仍然坚持如何按顺序阅读图片。

我想请你帮我在原代码的基础上实现怎样的顺序迭代单词图片?

这是我当前的代码from docx.document import Document as _Document

from docx.oxml.text.paragraph import CT_P

from docx.oxml.table import CT_Tbl

from docx.table import _Cell, Table, _Row

from docx.text.paragraph import Paragraph

import docx

path = './test.docx'

doc = docx.Document(path)

def iter_block_items(parent):

if isinstance(parent, _Document):

parent_elm = parent.element.body

elif isinstance(parent, _Cell):

parent_elm = parent._tc

elif isinstance(parent, _Row):

parent_elm = parent._tr

else:

raise ValueError("something's not right")

for child in parent_elm.iterchildren():

if isinstance(child, CT_P):

yield Paragraph(child, parent)

elif isinstance(child, CT_Tbl):

yield Table(child, parent)

for block in iter_block_items(doc):

# read Paragraph

if isinstance(block, Paragraph):

print(block.text)

# read table

elif isinstance(block, Table):

print(block.style.name)

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值