关注RPA请访问网站:
www.i-search.com.cn
学Python,用RPA,欢迎下载使用
https://www.i-search.com.cn/?from=csdn
word 转 excel 代码块分享:
使用前需要手动安装一下 python-docx 注意不是直接安装 doxc,目前 docx 好像没兼容 py3x,步骤如下
进入网址https://www.lfd.uci.edu/~gohlke/pythonlibs/
CTRL+F 查找 python_doxc 下载 python_docx‑0.8.10‑py2.py3‑none‑any.whl
版本号可能会有变化无所谓
进入命令窗口 cd 到下载的 whl 文件目录下,输入命令
pip install python_docx-0.8.10-py2.py3-none-any.whl
代码如下:
from docx import Document
import pandas as pd
def word_to_excel(word_path, excel_path):
word_lis = []
doc = Document(word_path)
for tb in doc.tables: # 遍历多个表
for row in tb.rows: # 遍历表的每一行
li = []
for cell in row.cells: # 遍历每一行的单元格
text = “”
for p in cell.paragraphs: # 遍历单元格中的每一段(回车符)
text += p.text
li.append(text)
word_lis.append(li)
list转dataframe
df = pd.DataFrame(word_lis)
保存到本地excel
df.to_excel(excel_path, index=False, header=0) # 若不需要将第一行设为表头 header = None
执行方法
word_path = ‘D:\wordtoexcel\wordtoexcel.docx’
excel_path = ‘D:\wordtoexcel\wordtoexcel.xlsx’
word_to_excel(word_path, excel_path)
运行结果展示