python是一门胶水语言_Python之父Guido van Rossum:教你用“胶水语言”实现办公自动化...

大家好,又到了Python办公自动化系列。

在之前的自动化系列文章中,我们分别讲过如何使用Python将Word中表格信息批量提取至Excel,也讲过如何将多个Excel表格汇总至Word,今天继续讲解如何将文字从PPT中提取出来并写入Word,主要将涉及如何使用python-pptx和python-docx交互操作word和ppt文件!

本文依旧来源于真实的办公自动化需求!

一、需求说明

有一份如图所示的ppt,包含了Python的介绍。现在需要将PPT中的文字都提取出来并写入Word中,如下图

二、涉及知识

代码实际上非常简单,基于python-pptx和python-docx两个模块即可,核心代码只有6行。但需要先熟悉PPT和Word两种文件的格式,可通过下面的图解对Word结构有个直观认识

不考虑表格图片等情况,一个纯文字组成的Word文档由文档document-段落paragraph-文字块run三级结构组成。再看一下ppt结构组成,会较Word复杂许多。当然这也跟PPT的高度自定义拓展性有关

简单来说,一个PPT文件为presentation,基本的结构为展示文件presentation-幻灯片页slide-形状shape组成,形状就需要区分开,是包含文本的形状还是不包含文本的形状(纯图片等)。如果是包含文本的形状,则可以获取内部的文本框,一个文本框又可以看作是一个小的word文档,包含段落paragraph-文字块run

有了以上的知识铺垫就可以写代码了。

三、Python实现

首先导入需要的模块

from pptx import Presentation

from docx import Document****

需要注意的是,安装的时候是python-docx和python-pptx,但实际运用都是pptx和docx。两个模块的相似点如下:安装名和导入名不同

安装名为 python-新版本后缀名,导入名为新版本后缀名

现在导入pptx文件,创建Word文件

wordfile = Document()

# 给定ppt文件所在的路径

filepath = r'xxxxxxxx'

pptx = Presentation(filepath)

接着遍历ppt,将文字写入word

# 遍历ppt文件的所有幻灯片页

for slide in pptx.slides:

# 遍历幻灯片页的所有形状

for shape in slide.shapes:

# 判断形状是否含有文本框,如果含有则顺序运行代码

if shape.has_text_frame:

# 获取文本框

text_frame = shape.text_frame

# 遍历文本框中的所有段落

for paragraph in text_frame.paragraphs:

# 将文本框中的段落文字写入word中

wordfile.add_paragraph(paragraph.text)

遍历ppt到段落就写入Word,而非遍历到底直到文字块才写入,因为段落更符合阅读习惯,一般遍历到文字块是需要对特定的字段词块进行操作才进行,最后记得保存Word文件

save_path = r'xxxxxxxx'

wordfile.save(save_path)

小结

这是经过一定改编的真实案例,可见Python自动化办公确实能够帮助我们解放自己的双手,不过在写自动化脚本之前也要掌握原理,明确思路再进行!如果对本文的代码和数据感兴趣可以在后台回复自动化获取,最后还是希望大家能够理解Python办公自动化的一个核心就是批量操作-解放双手,让复杂的工作自动化!

文末送书福利

再次给大家推荐一本书——>机器学习算法与框架实战(以一个自研机器学习算法框架的构建为主线,首先介绍了机器学习的相关概念和背景,然后按照代数矩阵运算层、*优化方法层、算法模型层和业务功能层的分层顺序对算法框架展开讲述,旨在通过理论和实践相结合的方式,帮助广大零算法基础的开发人员了解和掌握一定的算法能力,同时作为算法设计人员在工程实现上的参考范例)

python自动化办公宝典

其中 《python自动化办公宝典》 共包含六个章节97页,不仅有详细的代码解释,而且还有详细的图文说明,通俗易懂,让你轻松完成办公自动化。python使用openpyxl操作excel;

python使用PyPDF2和pdfplumber操作pdf;

python使用python-docx操作word;

python使用python-pptx操作PPT;

python如何自动收发邮件;

python制作电话号码归属地查询工具;

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值