【Python学习日记】利用docx库批量处理word文件

一、工具人

作为一个工具人,相信大家都有被老师或老板要求从很多word文档里复制粘贴相关信息到Excel中,这项工作怎么说呢,不难,但是很容易变得很暴躁😢。

今天我就碰到了,事情是这样的,老师丢给我一个全是word文档的文件夹,让我把每个文档中的姓名、预备期、手机号和报名岗位整理出来。还告诉我可能比较耗时间……

emmm,确实如此,做了几个我就不想做了,还好我会python,也就是分分钟的事情。
在这里插入图片描述

二、Python代码

from docx import Document
import os
import pandas as pd

path = "土木/"#存放word文件的上层目录
pathname = []
for filename in os.listdir(path):
    listname = "土木/" + filename#获取每一个word文档的相对路径
    pathname.append(listname)#将word文档的相对路径写入空数组
    
array = []
for filename in pathname:#按照文件名遍历每一个word文件
    doc  = Document(filename)
    table1 = doc.tables[0]#获取word中的第一个表格
    name = table1.rows[0].cells[2].text#获取第一个表格第一行第三列内容,对应姓名
    time = table1.rows[3].cells[2].text#获取第一个表格第四行第三列内容,对应预备期
    phone = table1.rows[4].cells[2].text#获取第一个表格第五行第三列内容,对应手机
    voluteer = table1.rows[5].cells[2].text#获取第一个表格第六行第三列内容,对应报名岗位
    message = []
    message.append(name)#将姓名添加到message数组
    message.append(time)#将时间添加到message数组
    message.append(voluteer)#将报名岗位添加到message数组
    message.append(phone)#将手机号添加到message数组
    array.append(message)
    
data = pd.DataFrame(array)#将array数组转化为dataframe对象
data.to_excel("汇总.xlsx")#将dataframe对象写入汇总表

大功告成!

由于涉及部分同学的隐私,就不展示最终的excel表格了。

如果觉得有用,不如点个赞再走呀!

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

王贝贝的爸爸

觉得有用给点鼓励吧,求求你了

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值