python replace_Python操作PPT实现自动查找替换

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者:多巴胺爱学习

转载:

https://mp.weixin.qq.com/s?src=11&timestamp=1593237958&ver=2425&signature=LUi9wLWFlM8CTRF3o9QzN4Sr*-Lth-S3i9-NZPRZZki6GYVyWomEXLHvF*-ifTG6PIaYUitBmSWsdkkSYTN3R-2NgY2KO22ufpL07NPoF-iGZFKT33cQq7LL6JZjhBQJ&new=1​mp.weixin.qq.com

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取python免费学习资料

为什么要这么干

万事皆有缘由,以下纯属YY,不想看的可以直接忽略。

OCR文字识别已经很流行了,我们做PPT的时候经常会用文字识别软件来获得内容(好吧,我经常这么干。。。)。OCR软件在识别文字上的准确性已经比较高了,但是标点符合却差强人意,逗号、分号、冒号之类的经常会被识别为半角,这个时候就需要改了。

当然,我们可以用ppt当中的替换功能手工替换。

再当然,我们还可以用ppt的宏功能实现,使用起来更方便。只是这个宏,目前我还没写出来,写出来后再另外分享了。

本次操作环境

操作系统:win10

Python版本:3.7

使用的第三方库:python-pptx

如果没有安装第三方库的话,需要先安装下:

  • Windows:pip install python-pptx
  • Mac:pip3 install python-pptx

PPT科普

PPT是由许多页组成的,页叫做Slide;

每一页又包含了许多组件,像文本框、表格,这些组件叫做Shape。我们做PPT的时候,文字主要就是放在文本框或者表格中的;

文本框中的文字是以段落的形式存在的,段落叫做Paragraph;

表格是由单元格组成的,单元格叫做Cell,单元格中的文字,也是由段落组成的。如下图:

v2-eb623a5e71a8e2638a2d14bef1c7a333_b.jpg

代码实现

代码实现的原理很简单,遍历Slide找Shape;遍历Shape找Paragraph;遍历Paragraph找run(run简单点理解就是文字块);在run中看看有没有需要替换的字符,有的话就替换了。

import 

后记

用Python与ppt、word进行交互是一个比较鸡肋的想法,99%的情况下,都是闲的无聊,微软的office功能已经不要太强大了。

用Python操作excel,相比于office,在个别情况(数据量大,或者需要实现的分析步骤太多,太复杂之类的)下可能具有优势,但通常情况下也用不到。

对于普通办公需求,从实用角度来说,学好office比学什么python,R,matlab,SPSS之类的有用多了。毕竟office的强大,只有你想不到的,没有它做不到的(安装包也够大的,打开之后电脑风扇转的哇哇哇的响)。

当然,会点Python,matlab之类的,你找工作的时候可以写在简历上。工作中真碰到坑了,也可以咬咬牙自己去填。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值