【Python】python读取docx文件里的表格内容并存入excel中

通过Python的docx和openpyxl库,实现批量读取Word文档中的表格内容,并将其高效地写入Excel文件,大大节省了手动操作的时间,虽然需要后期在Excel中删除多余内容,但整体效率提升明显。
摘要由CSDN通过智能技术生成

需要将word中的表格内容读取出来复制到excel里,因为文档较多、表格内容较多,直接复制粘贴比较费时,想到用python读取word文档中表格内容并存入excel中。

代码部分:

首先要先安装相关的模块:
使用docx文件需要加载:

pip install python-docx

使用xlsx文件需要加载:

pip install openpyxl

接下来是代码部分,注释也都齐全:

# -*- coding:utf-8 -*-

import os
import docx
from docx import Document #导入库
from win32com.client import Dispatch
from openpyxl import  Workbook 
from openpyxl import workbook
from openpyxl import load_workbook
#文件路径
path  = r'D:\ttj\06.20'
workbook = load_workbook(path + r'\第5批.xlsx')
sheet = workbook.active
#打开哪个表
sheet=workbook["40"]
word = Document(path + r'\40.docx')
tables=word.tables
for i in range(len(tables)):
    tb=tables[i]
    #获取表格的行
    tb_rows=tb.rows
    #读取每一行内容
    for i in range(len(tb_rows)):
        row_data=[]
        row_cells=tb_rows[i].cells
        #读取每一行单元格内容
        for cell in row_cells:
            row_data.append(cell.text)#单元格内容
        print(row_data) #打印整行数据
        sheet.append(row_data)#逐行写到excel中
       
workbook.save(path + r'\第5批.xlsx')
print('写入完成')

最终结果,是个半自动的,会把表格上方部分内容也复制到excel里,需要在excel里手动删除,但是整体效率提高了,不影响使用。

### 回答1: Python提供了多种将Word内容写入Excel表格的方法。其一种常用的方法是使用Python的`pandas`库。 首先,需要确保已经安装了`pandas`库。可以使用以下命令进行安装: ``` pip install pandas ``` 接下来,需要使用Python的`python-docx`库来读取Word文档内容。同样,可以使用以下命令进行安装: ``` pip install python-docx ``` 下面是一个简单的示例代码,演示了如何将Word文档内容写入Excel表格: ```python import os import pandas as pd from docx import Document # 读取Word文档内容 doc_path = 'path_to_your_word_document.docx' document = Document(doc_path) text = [p.text for p in document.paragraphs] # 创建一个DataFrame对象 df = pd.DataFrame({'内容': text}) # 将DataFrame写入Excel表格 excel_path = 'path_to_your_excel_file.xlsx' df.to_excel(excel_path, index=False) print('内容已成功写入Excel表格!') ``` 在这个示例,按照你的需要将`path_to_your_word_document.docx`替换为你实际的Word文档路径,将`path_to_your_excel_file.xlsx`替换为你期望的Excel表格路径。最后,程序将Word文档内容写入指定的Excel表格,并输出成功的提示信息。 请注意,这只是其一种实现方式。根据具体的需求,还可以使用其他Python库,如`openpyxl`、`xlrd`等来完成类似的任务。 ### 回答2: Python可以使用多种方式来实现将Word内容写入Excel表格的操作。下面是使用python-docx和openpyxl库的一种方法。 首先需要安装相关库,可以在终端使用以下命令进行安装: ``` pip install python-docx pip install openpyxl ``` 使用python-docx库可以读取Word内容,openpyxl库可以创建和写入Excel表格。具体代码如下: ```python from docx import Document from openpyxl import Workbook # 读取Word内容 doc = Document('example.docx') content = [] for paragraph in doc.paragraphs: content.append(paragraph.text) # 创建Excel表格并写入内容 wb = Workbook() ws = wb.active for i, line in enumerate(content): ws.cell(row=i+1, column=1, value=line) # 保存Excel表格 wb.save('example.xlsx') ``` 上述代码,通过`Document('example.docx')`打开Word文档,并使用`paragraphs`属性获取每个段落的文本内容,将其存入`content`列表。接着,创建一个Excel工作簿对象,通过`cell`方法将`content`列表内容逐行写入Excel表格。最后,使用`save`方法保存Excel表格。 请注意,以上代码只是简单示例,并且可能无法处理Word的一些特殊格式。如果Word包含表格等其他元素,可能需要更复杂的处理方式。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值