Office宏 PowerPoint提取文字到Word - -

PowerPoint直接转存为大纲格式Word,会丢失一些非标题的内容文字,使用简单的脚本尽可能多的提取幻灯片中的文字到WORD。
该宏需要引用对应的WORD库。

Attribute VB_Name = "模块1"
Sub toWord()
On Error Resume Next
Dim a As New Application
Dim sl As PowerPoint.slide
Dim sh As PowerPoint.shape
Dim c As PowerPoint.View
Dim i As Integer
i = 1
Dim str As String
str = ""
Set c = Application.ActiveWindow.View
For Each sl In PowerPoint.ActivePresentation.Slides
c.GotoSlide i
 str = str + "page" + VBA.str(i) + vbLf
 For Each sh In sl.Shapes
   sh.Select
   str = str + a.ActiveWindow.Selection.TextRange.Text + vbLf
 Next sh
i = i + 1
str = str + "----------------------------------------------" + vbLf
Next sl
Dim d As New Word.Application
Dim dd As Word.Document
d.Visible = True
d.Activate
Set dd = d.Documents.Add
dd.Select
dd.Words.First.Text = str
End Sub

Java可以使用Apache POI和PDFBox这两个开源库来提取Word和PDF文档中的文字内容。 1. 使用Apache POI提取Word文档中的文字内容 Apache POI是一个用于操作Microsoft Office格式文件的Java API。它可以用于读取、写入和操作Word、Excel和PowerPoint等文件。下面是使用Apache POI提取Word文档中的文字内容的示例代码: ```java import java.io.FileInputStream; import org.apache.poi.xwpf.extractor.XWPFWordExtractor; import org.apache.poi.xwpf.usermodel.XWPFDocument; public class WordExtractorExample { public static void main(String[] args) throws Exception { String filePath = "example.docx"; FileInputStream fis = new FileInputStream(filePath); XWPFDocument document = new XWPFDocument(fis); XWPFWordExtractor extractor = new XWPFWordExtractor(document); String text = extractor.getText(); System.out.println(text); fis.close(); } } ``` 2. 使用PDFBox提取PDF文档中的文字内容 PDFBox是一个开源的Java库,用于处理PDF文档。它可以用于创建、修改和提取PDF文档中的内容。下面是使用PDFBox提取PDF文档中的文字内容的示例代码: ```java import java.io.File; import java.io.IOException; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.text.PDFTextStripper; public class PdfExtractorExample { public static void main(String[] args) throws IOException { String filePath = "example.pdf"; File file = new File(filePath); PDDocument document = PDDocument.load(file); PDFTextStripper stripper = new PDFTextStripper(); String text = stripper.getText(document); System.out.println(text); document.close(); } } ``` 以上就是使用Java提取Word和PDF文档中的文字内容的示例代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值