主要使用 “baliance.com/gooxml” 中的 presentation 包
原理:windows下pptx格式文件实际上是一个压缩包,打开之后可以看到具体的格式
下列代码主要是获取文件中的所有文本,如下:
package main
import (
"fmt"
"runtime"
"time"
"baliance.com/gooxml/presentation"
)
func main() {
ppt, err := presentation.Open("测试.pptx")
if err != nil {
fmt.Println(err)
return
}
//循环每页ppt
for _, slide := range ppt.Slides() {
//所有的控件
for _, choice := range slide.X().CSld.SpTree.Choice {
if choice.Sp == nil {
continue
}
//一个文本框或一个控件
for _, sp := range choice.Sp {
if sp.TxBody == nil {
continue
}
//数据
for _, p := range sp.TxBody.P {
textrun := p.EG_TextRun
var text string
//所有的EG_TextRun中的数据组合起来是一段
for _, run := range textrun {
if run.R != nil {
text += run.R.T
}
}
if len(text) == 0 {
continue
}
//打印一段数据
fmt.Println(text)
}
}
}
}
}