【办公自动化实例】批量提取ppt文件中的文本和表格信息并存入word文档中。

一、需求
批量从PPT中提取相关文本内容和表格内容,并保存至word文档中,参考例子如图:

在这里插入图片描述

二、处理方式
1、通过os模块遍历文件,提取pptx格式文件;
2、通过python-pptx模块,进行pptx文件内容的提取;
3、通过python-docx模块,将提取的内容写入word文档中。
注:
	1、图片内容不能使用此方法提取,可通过压缩文件后,提取压缩包中的图片来实现;
	2、信息提取顺序是根据编写ppt时,shape的写入顺序来决定的。
	3、python版本 3.8
		 python-docx版本 0.8.10
		 python-pptx版本 0.6.19
三、代码实现
from pptx import Presentation
from docx import Document
import os

doc = Document()

for file in os.scandir():
    # 先判断文件类型
    if file.name.endswith('.pptx'):
        prs = Presentation(file.name)
        table_ls=[]

        # 读取PPT中各页幻灯片
        for slide in prs.slides:
            # 读取每页幻灯片的形状, 就是文字框、表格块等
            for shape in slide.shapes:
                #判断形状的类型
                if shape.has_text_frame:
                    text_frame = shape.text_frame
                    doc.add_paragraph(text_frame.text)
                    
                elif shape.has_table:
                    table = shape.table
                    table_rows = len(table.rows)
                    table_cols = len(table.columns)
                    
                    # 按行提取表格的内容
                    for row in table.rows:
                        row_ls=[]
                        for cell in row.cells:
                            row_ls.append(cell.text)
                        table_ls.append(row_ls)
                        
                    # 在word文档中创建表格,设置格式,写入内容
                    table = doc.add_table(rows = table_rows,cols = table_cols)
                    table.style = 'Light Grid'
                    for row in range(table_rows):
                        cells = table.rows[row].cells
                        for col in range(table_cols):
                            cells[col].text = str(table_ls[row][col])
doc.save('demo.docx')                        

最终实现如图:
在这里插入图片描述

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值