用 python-docx 比对 Word VS Excel 中的表格

本文介绍了如何使用python-docx库来比对Word文档中的表格数据与Excel中的数据。通过示例展示了如何安装python-docx,读取Word表格,并与Excel数据进行匹配,以实现自动化比对和格式化处理,帮助简化数据核对工作。
摘要由CSDN通过智能技术生成

Python 自动化:python-docx 比对 Word 文档与 Excel 表格

应用场景

小明的老师要打印学生成绩单,于是制作了一份 Word 文档,每个学生的成绩单为一个表格,如下图所示:
Word 数据
但是核对 Excel 中的成绩时发现存在一些错误,比如小明的班级、小霞的数学成绩:
Excel 数据
每个学生(逐行)每个字段(逐列)比对了一番苦不堪言,那我们可不可以用 Python来帮帮老师呢?

作为无所不能的 Python 大法,这自然不在话下!

下面便介绍如何用 python-docx 读取 Word 文档中的表格数据并与 Excel 中的数据比对 👇

python-docx 介绍

python-docx是用于创建和更新 Microsoft Word(.docx)文件的 Python 库。

安装

python-docx 托管在 PyPI 上,可以很方便地用 pip 安装:

pip install python-docx
  • 支持 Python 2.6、2.7、3.3、3.4(本文运行环境为 3.6,尚未发现安装和使用的异常)
  • 会自动安装依赖库:lxml> = 2.3.2

示例

成功安装后,运行以下示例代码1,体验一下效果:

ps.注意在运行目录下准备一张图片:image.png

# 导包
from docx import Document
from docx.shared import Inches

# 创建空白文档
document = Document()
# 添加标题
document.add_heading('Document Title', 0)
# 添加段落
p = document.add_paragraph('A plain paragraph having some ')
# 添加不同格式的文字
p.add_run('bold').bold = True
p.add_run(' and some ')
p.add_run('italic.').italic = True
# 添加一级标题
document.add_heading('Heading, level 1', level=1)
# 添加不同样式的段落
document.add_paragraph('Intense quote', style='Intense Quote')
document.add_paragraph(
    'first item in unordered list', style
我们经常会遇到这样的问题: 1、 撰写工作报告、演讲文稿或相关方案,经常是改了再写,写了再改,有时候甚至需要预备多个版本。通常的做法是将每个版本的文档单独保存为一个文件,相似的文件多了,不仅占用了磁盘空间,而且管理起来也不方便。 2、 “客户昨天把合同发给小张,说合同做了些调整,让小张看看后如果没有什么疑问就可以签字了”,合同的一字之差、一个标点都有可能使问题性质大变,而这些细微差别很难人工识别。 3、 “小王,昨天领导看了你写的财务方案,做了一些修改,你最后再完善一下。”今天一上班,主任就给小王安排了任务。老总究竟修改了哪些地方?怎么样才能快速精确地比较出两份文件的异同呢?难道去问老总?用眼睛直接观察?小王犯愁了。 相信类似的问题,大家在日常工作也会经常遇到,面对电脑以及公司网络上各种版本的文件,还有一些修改过多少次的文档,如何知道这些相似文档的差别在哪些地方、都进行过哪些改动,有一些只有极为细小的区别,如果仅仅凭借手工来逐个查找文档的不同之处,会浪费不少时间和精力。 有没有什么好办法可以解决这个问题呢?当然有! 现在有很多种文件比较工具可以用来查找两个文本文件是否相同,而且往往比使用Word更加直观,例如“叮当文档比较器(DD-Compare)”就是一个很有特色的文件直观比较工具,她可以比较两个文件的不同处,提供在同一窗口内开左右两个窗格显示两个文件的内容,你可用鼠标或键盘操作进行对照。 下面简单介绍一下叮当文档比较器如何帮助你一目了然识别两个文档之间的差异:FileCompare 第一步、下载(下载地址:http://www.ddpace.com)叮当文档比较器(DD-Compare),并完成安装,安装过程比较简单,这里不做具体介绍; 第二步、到叮当文档比较器软件的官方网站注册一下用户,只需要姓名和电子邮件就可以了; 第三步、选择要比较的文件,文件格式支持doc、docx、xls、xlsx、ppt、pptx、txt、htm、html等9种格式。 第四步、点击“比较上述两个文件”,显示出两个文件的差异所在,如下图所示。 利用叮当文档比较器(DD-Compare)的比较文档功能,可以大大减轻你的工作量,提高准确性和工作效率。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值