python代码实现将word文件中的内容写入excel表中~

样例:

n个word文档是存放在文件夹中的,依次读取文件夹中的文档,再将文档中的内容写入excel表中的【内容】列,文档名写入【文件名】列

代码:

import os
import pandas as pd
import openpyxl
import docx
#返回指定路径下的所有文件,不包含子目录。
path= [r"Y:\机器-订单转写结果-202308040101249824",
       r"Y:\机器-订单转写结果-202308040101408586"]
#有多少个文件夹就写入多少个文件夹地址
# file = os.listdir(path)
# print(file)
data=pd.DataFrame()
k=0
for p in path:
    file = os.listdir(p)
    print(len(file))
    for i in file:
        print(i)
        data.loc[k, 0] = i
        file_path = p + "/" + i
        file = docx.Document(file_path)
        txt = '\n'
        for para in file.paragraphs:
            print(para.text)
            if '.mp4' not in para.text:
                txt = txt + para.text
        data.loc[k, 1] = txt
        k = k + 1
data.columns=['文件名','内容']
data.to_excel(r"Y:\机器-订单转写结果.xlsx",index=False)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值