python—如何提取word中指定内容

        假设有一个Word,该Word中存在 “联系人” 关键字,如何将该Word中的联系人所对应的内容提取出来呢?  该Word内容如下所示:       

      
        要在给定的Word文档中提取出与"联系人"关键字对应的内容,可以使用Python的python-docx库。以下是一个示例:

import docx

# 加载Word文档
doc = docx.Document('your_document.docx')

# 存储提取的内容
contacts = []

# 遍历文档中的段落并提取联系人关键字对应的内容
for paragraph in doc.paragraphs:
    if '联系人' in paragraph.text:
        # 获取关键字后面的内容
        contact = paragraph.text.split('联系人', 1)[1]
        contacts.append(contact.strip())

# 显示提取的内容
for contact in contacts:
    print(contact)

        在上面的代码中,将'your_document.docx'替换为你要读取的Word文档的文件名或路径。

        运行代码后,将会显示与"联系人"关键字对应的内容。请注意,在提取"联系人"关键字的内容时,假设该关键字后面的内容是需要提取的信息。如果情况不符合,可能需要根据具体的Word文档结构和需求进行调整。

        确保已经安装了python-docx库。如果尚未安装,可以使用以下命令进行安装:

pip install python-docx
        通过以上步骤,你就可以在Python中成功提取Word文档中与"联系人"关键字对应的内容了。

运行上述代码得到运行结果为:

联系人:张三
联系人:李四
联系人:王五

 若想同时获取联系人及对应的电话,则在遍历部分代码中添加 '电话' 关键字即可,如下所示:

# 遍历文档中的段落并提取指定内容
for paragraph in doc.paragraphs:
    if '联系人' in paragraph.text:
        target_content.append(paragraph.text)
    elif '电话' in paragraph.text:
        target_content.append(paragraph.text)

添加之后程序运行结果: 

联系人:张三
电话:153***55899
联系人:李四
电话:139***08783
联系人:王五
电话:139***52328

  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值