python replace_Python操作PPT实现自动查找替换

最新推荐文章于 2023-02-03 11:56:53 发布

weixin_40003233

最新推荐文章于 2023-02-03 11:56:53 发布

阅读量251

点赞数

文章标签： python replace

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者：多巴胺爱学习

转载：

https://mp.weixin.qq.com/s?src=11&timestamp=1593237958&ver=2425&signature=LUi9wLWFlM8CTRF3o9QzN4Sr*-Lth-S3i9-NZPRZZki6GYVyWomEXLHvF*-ifTG6PIaYUitBmSWsdkkSYTN3R-2NgY2KO22ufpL07NPoF-iGZFKT33cQq7LL6JZjhBQJ&new=1mp.weixin.qq.com

PS：如有需要Python学习资料的小伙伴可以加点击下方链接自行获取python免费学习资料

为什么要这么干

万事皆有缘由，以下纯属YY，不想看的可以直接忽略。

OCR文字识别已经很流行了，我们做PPT的时候经常会用文字识别软件来获得内容（好吧，我经常这么干。。。）。OCR软件在识别文字上的准确性已经比较高了，但是标点符合却差强人意，逗号、分号、冒号之类的经常会被识别为半角，这个时候就需要改了。

当然，我们可以用ppt当中的替换功能手工替换。

再当然，我们还可以用ppt的宏功能实现，使用起来更方便。只是这个宏，目前我还没写出来，写出来后再另外分享了。

本次操作环境

操作系统：win10

Python版本：3.7

使用的第三方库：python-pptx

如果没有安装第三方库的话，需要先安装下：

Windows：pip install python-pptx
Mac：pip3 install python-pptx

PPT科普

PPT是由许多页组成的，页叫做Slide；

每一页又包含了许多组件，像文本框、表格，这些组件叫做Shape。我们做PPT的时候，文字主要就是放在文本框或者表格中的；

文本框中的文字是以段落的形式存在的，段落叫做Paragraph；

表格是由单元格组成的，单元格叫做Cell，单元格中的文字，也是由段落组成的。如下图：

代码实现

代码实现的原理很简单，遍历Slide找Shape；遍历Shape找Paragraph；遍历Paragraph找run（run简单点理解就是文字块）；在run中看看有没有需要替换的字符，有的话就替换了。

import

后记

用Python与ppt、word进行交互是一个比较鸡肋的想法，99%的情况下，都是闲的无聊，微软的office功能已经不要太强大了。

用Python操作excel，相比于office，在个别情况（数据量大，或者需要实现的分析步骤太多，太复杂之类的）下可能具有优势，但通常情况下也用不到。

对于普通办公需求，从实用角度来说，学好office比学什么python，R，matlab，SPSS之类的有用多了。毕竟office的强大，只有你想不到的，没有它做不到的（安装包也够大的，打开之后电脑风扇转的哇哇哇的响）。

当然，会点Python，matlab之类的，你找工作的时候可以写在简历上。工作中真碰到坑了，也可以咬咬牙自己去填。

weixin_40003233

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python replace_Python操作PPT实现自动查找替换

前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。作者：多巴胺爱学习转载：https://mp.weixin.qq.com/s?src=11&timestamp=1593237958&ver=2425&signature=LUi9wLWFlM8CTRF3o9QzN4Sr*-Lth-S3i9-NZPRZZ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。