python自动化办公——定制化读取Excel数据并写入到word表格

Python自动化办公——Excel写word表格

一、引言

最近到了毕业设计答辩的时候,老师让我帮毕业生写一段毕业设计的功能就是提供一个学士学位授予申请表,根据定制化需求,编写定制化代码。

二、数据准备

docx格式的word如下图。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JBrj88Zk-1687013257270)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20230615225250472.png)]

再提供一个Excel表格,要求可以直接读取表格里的对应内容,填入到word表格里的对应位置。表格是我自己定义的如下表:

学生姓名所在院系班级简称学号(10位)学制身份证号专业名称外语A级外语四级外语六级专业四级专业八级项目名称1项目名称2项目名称3项目名称4项目名称5项目名称6项目名称7项目名称8奖励绩点1奖励绩点2奖励绩点3奖励绩点4奖励绩点5奖励绩点6奖励绩点7奖励绩点8处分名称1处分名称2处分名称3罚扣绩点1罚扣绩点2罚扣绩点3处分时间1处分时间2处分时间3
天海电子与信息工程学院智能BG201744411115555452013145555人工智能智慧农业可视化计算机视觉教辅计赛国家一等奖互联网+省二等奖0.20.20.40.1偷吃老师抽屉的饼干撒谎的人要吞一千根针哦0.10.92023年6年15日2022年12月14日

三、python代码

那么根据定制化需求,我制作了三套代码。

1、方法一

我们的逻辑是:

  1. 读取Excel文件
  2. 找准word中表格对应位置与顺序
  3. 插入读取到Excel中的数据到word表格中

先展示最终嵌入到项目中的代码吧.

首先需要引入docx的库和pandas库,注意由于docx库的版本不同使用的方法也有一定差异

import docx
from docx.enum.text import WD_ALIGN_PARAGRAPH
import pandas as pd

接下来进行第一步,读取表格数据,并打开word

#打开或创建word文档
doc_name = "test.docx"
doc = docx.Document(doc_name)
# 读取Excel数据
df = pd.read_excel('source.xlsx', sheet_name='info')

content = [list(row) for _, row in df.iterrows()]

print(content)

人为分析了word的表格索引位置,并写入index中

table = doc.tables[0]

index = [[0,3],[0,12],[1,3],[1,12],[2,3],[2,12],[5,3],
[5,5],[5,10],[5,13],[5,16],[7,7],[7,16],[8,7],[8,16],
[9,7],[9,16],[10,7],[10,16],[12,3],[12,7],[12,11],
[13,3],[13,7],[13,11],[14,3],[14,7],[14,11]]

写入28条数据并将空的数据输入空格,设置居中和宋体字体,随后将输出的word保存为学号+.docx

for i in range(0,28):
	cell = table.cell(index[i][0],index[i][1])
	cell.text = str(content[0][i])
	if cell.text == 'nan':
		cell.text = ' '
	print('%d:'%i,cell.text)
	cell.paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
	for par in cell.paragraphs:
		for run in par.runs:
			run.font.size = docx.shared.Pt(12)
			run.font.name = '宋体'


filename = str(df.iloc[0, 3])
doc.save(filename + '.docx')

完整代码如下:

    file_name = "D:\\poppler-0.67.0_x86\\test1.docx"
    doc = docx.Document(file_name)
    df = pd.read_excel('D:\\poppler-0.67.0_x86\\学员表.xlsx', sheet_name='info')
    print(df)
    for item in range(df.shape[0]):
        content = [list(row) for _, row in df.iterrows()]
        table = doc.tables[0]
        index = [[0, 3], [0, 12], [1, 3], [1, 12], [2, 3], [2, 12], [5, 3],
                 [5, 5], [5, 10], [5, 13], [5, 16], [7, 7], [7, 16], [8, 7], [8, 16],
                 [9, 7], [9, 16], [10, 7], [10, 16], [12, 3], [12, 7], [12, 11],
                 [13, 3], [13, 7], [13, 11], [14, 3], [14, 7], [14, 11]]
        for i in range(0, 28):
            cell = table.cell(index[i][0], index[i][1])
            cell.text = str(content[item][i])
            if cell.text == 'nan':
                cell.text = ' '
            cell.paragraphs[0].alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
            for par in cell.paragraphs:
                for run in par.runs:
                    run.font.size = docx.shared.Pt(12)
                    run.font.name = '宋体'

        file_name = 'D:\\poppler-0.67.0_x86\\doc_output\\' + str(df.iloc[item, 3]) + '.docx'
        # file_name = "D:\\poppler-0.67.0_x86\\7414119104.docx"
        doc.save(file_name)
        print("保存成功!")

这样一来,Excel里所有的行都会输出为word文件,有几行数据就能输出几个word,且以学号命名。
缺点:需要自己分析模板word并写死索引

2、方法二

使用的方法二就是精简版的方法一,原理就是不考虑word表格分布写入数据,而是自己在代码里写一个新的word表格进行插入数据。

具体步骤如下:

  1. 读取Excel数据
  2. 生成、配置word的表格和名称
  3. 填写表格
  4. 保存word

代码如下:

这里我就是定义了两个循环来生成简单的37行2列的表格并填写数据

import pandas as pd
from docx import Document
from docx.shared import Inches

# 读取Excel数据
df = pd.read_excel('source.xlsx', sheet_name='info')

# 获取表格标题和内容
header = list(df.columns)
content = [list(row) for _, row in df.iterrows()]

# 生成Word文件名
filename = df.iloc[0, 3]
# 配置Word
document = Document('output.docx')
table = document.add_table(rows=37, cols=2, style='Table Grid')

# 填写表格
for i, text in enumerate(header):
    table.cell(i, 0).text = text
for i, row in enumerate(content):
    for j, text in enumerate(row):
        table.cell(j, i+1).text = str(text)

# 保存Word文件
document.save(f'{filename}.docx')

3、方法三

使用字符串匹配来进行变量的写入,缺点:无法进行表格写入,可以在无表格的word文章中发挥很大优势。

可以使用pyqt5来制作一个小工具进行文字替换。这里我也实现了,但由于代码量过大,这里不做介绍啦,有需要的可以私信我,再进行更新。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-a0K8kmBb-1687013257271)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20230617224638416.png)]
document.save(f'{filename}.docx')

  • 10
    点赞
  • 73
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

天海一直在AI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值