如何用Python批量提取PPT中含有某关键词的一页,并将这些PPT合并

前提:我有一堆PPT文件:1.pptx、2.pptx、3.pptx......每个文件中都含有若干张幻灯片,这若干张幻灯片中都有一张含有某个关键词的一页,例如含有”月分析“,(我就是每个月要从每个分公司中提取他们的月分析)

需求:将这些含有关键词的PPTX文件,删除无关的页,只保留含有关键词的页,并替换关键词,防止混乱,最后将这些ppt全部合并。

奏乐,代码上:

import pptx
from pptx import Presentation
import os
import re
#import ALL

def replace_text(text_frame):#该函数实现的是文本替换功能
    for paragraph in text_frame.paragraphs:
        for run in paragraph.runs:
            for tt in TEXT_NEED_REPLACE:
                if tt[0] in run.text:
                    run.text = run.text.replace(tt[0], tt[1])

def process_ppt(filename_open, filename_save,Procices):
    prs = Presentation(filename_open)
    m=0;
    for slide in prs.slides:
        for shape in slide.shapes:
            if shape.has_text_frame:#判断Shape是否含有文本框
                text_frame = shape.text_frame
                for paragraph in
  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值