批量提取会议通知书关键信息

批量提取(Word->Excel)会议通知书关键信息

源代码:

from docx import Document
from openpyxl import Workbook
import glob

path = r'E:\0616\untitled\wxhs\Batch processing\会议通知'
workbook = Workbook()
sheet = workbook.active
header = ['序号','时间','地点','参加人员','内容']
sheet.append(header)
number = 0


for file in glob.glob(path+r'\*.docx'):
    content_list = []
    meeting_file = Document(file)
    for paragraph in meeting_file.paragraphs:
        # 可以知道每一行
        # print(paragraph.text)
        if paragraph.text[0:3] == '时间:':
            mtime = paragraph.text[3:]
        if paragraph.text[0:3] == '地点:':
            mplace = paragraph.text[3:]
        if paragraph.text[0:5] == '参加人员:':
            mpeople = paragraph.text[5:]
        if len(paragraph.text)>=2:
            if paragraph.text[0].isdigit() and paragraph.text[1] == '.':
                content_list.append(paragraph.text)
    content = ';'.join(content_list)
    number += 1
    sheet.append([number,mtime,mplace,mpeople,content])
workbook.save('./会议提取关键信息.xlsx')
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值