1、python-pptx模块简介
使用python操作PPT,需要使用的模块就是python-pptx,下面来对该模块做一个简单的介绍。
这里提前做一个说明:python操作PPT,最好是我们提前设计好自己的一套样式,然后利用进行python进行内容的获取和填充(最主要的功能!),最好是不用使用python代码操作PPT的格式,格式的修改肯定不如我们直接在PPT中修改方便。可以创建、修改PPT(.pptx)文件
需要单独安装,不包含在Python标准模块里
2、模块的安装与导入
1)模块的安装
"Windows用户命令行下输入"
pip install python-pptx
"Mac用户命令行下输入"
pip3 install python-pptx
2)模块的导入
这里有一点需要注意的是:安装的库是python-pptx,但是导入的时候却有点不同。
import pptx
3、python读取PPT文档中的内容
1)PPT的结构说明
在使用python操作PPT之前,首先应该清楚PPT的结构,这个对于之后代码的编写很有帮助。
2)获取Slide
from pptx import Presentation
prs = Presentation("统计学习方法PPT.pptx")
for slide in prs.slides:
print(slide)
结果如下:
3)获取Shape形状
import pptx
from pptx import Presentation
prs = Presentation("统计学习方法PPT.pptx")
for slide in prs.slides:
for shape in slide.shapes:
print(shape)
"""
注意:这里得到的Shape对象,并不能看出什么,接着往下看。
"""
结果如下:
4)判断每个Shape中是否存在文字shape.has_text_frame :是否有文字
shape.text_frame :获取文字框
import pptx
from pptx import Presentation
prs = Presentation("统计学习方法PPT.pptx")
for slide in prs.slides:
for shape in slide.shapes:
if shape.has_text_frame:
text_frame = shape.text_frame
print(text_frame.text)
结果如下:
5)获取某一页Slide中的内容
import pptx
from pptx import Presentation
prs = Presentation("统计学习方法PPT.pptx")
for i,slide in enumerate(prs.slides):
if i == 5:
for shape in slide.shapes:
if shape.has_text_frame:
text_frame = shape.text_frame
print(text_frame.text)
结果如下:
6)获取Shape中的某个Paragraph
import pptx
from pptx import Presentation
prs = Presentation("统计学习方法PPT.pptx")
for i,slide in enumerate(prs.slides):
if i == 5:
for shape in slide.shapes:
if shape.has_text_frame:
text_frame = shape.text_frame
for paragraph in text_frame.paragraphs:
print(paragraph.text)
"""
注意:该方法和上述4)中的方法一摸一样。上述方法是直接获取Shpae中的文字内容;
下面这个更灵活,先获取每个Shape,然后在获取每个Shape中的paragraph;
下面方式更好:因为我们可以针对paragraph,写一个判断条件,只获取第几个paragraph;
"""
结果如下:
4、利用python像PPT中写入内容
1)幻灯片模板及占位符的概念
2)怎么自定义母版?
3)什么是版式?
这个概念在下面的效果中,会得以体现。其中prs.slide_layouts[]传入0表示获取的是第一个版式,传入1表示获取的是第二个版式,以此类推下去。
4)添加Slide和内容
这里就需要使用上述的自定义母版。因为毕竟是使用python操作PPT,我们可以定义好自己想要展示的PPT母版,然后借