最近做的项目要把PPT中的文本提取出来做其他任务,现把PPT提取文本的过程摘出来做个记录,主要是组合shape需要通过迭代的方式进行解析(iter_shape函数)
import pptx
def iter_shape(shape, text_shapes):
if type(shape) == pptx.shapes.group.GroupShape:
for sshape in shape
最近做的项目要把PPT中的文本提取出来做其他任务,现把PPT提取文本的过程摘出来做个记录,主要是组合shape需要通过迭代的方式进行解析(iter_shape函数)
import pptx
def iter_shape(shape, text_shapes):
if type(shape) == pptx.shapes.group.GroupShape:
for sshape in shape