go读取pptx文件

主要使用 “baliance.com/gooxml” 中的 presentation 包
原理:windows下pptx格式文件实际上是一个压缩包,打开之后可以看到具体的格式
下列代码主要是获取文件中的所有文本,如下:

package main

import (
	"fmt"
	"runtime"
	"time"
	"baliance.com/gooxml/presentation"
)

func main() {
	ppt, err := presentation.Open("测试.pptx")
	if err != nil {
		fmt.Println(err)
		return
	}
	//循环每页ppt
	for _, slide := range ppt.Slides() {
		//所有的控件
		for _, choice := range slide.X().CSld.SpTree.Choice {
			if choice.Sp == nil {
				continue
			}
			//一个文本框或一个控件
			for _, sp := range choice.Sp {
				if sp.TxBody == nil {
					continue
				}
				//数据
				for _, p := range sp.TxBody.P {
					textrun := p.EG_TextRun
					var text string
					//所有的EG_TextRun中的数据组合起来是一段
					for _, run := range textrun {
						if run.R != nil {
							text += run.R.T
						}
					}
					if len(text) == 0 {
						continue
					}
					//打印一段数据
					fmt.Println(text)
				}
			}
		}

	}
}

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值