1.Spire.Doc地址
2.实现步骤
1.maven依赖
首先在pom文件中引入下面的依赖
<repositories>
<repository>
<id>com.e-iceblue</id>
<name>e-iceblue</name>
<url>https://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.doc</artifactId>
<version>12.4.1</version>
</dependency>
</dependencies>
2.对于本地文件进行提取
import com.spire.doc.Document;
import java.io.FileWriter;
import java.io.IOException;
public class ExtractText {
public static void main(String[] args) throws IOException {
//创建一个Document类的对象
Document document = new Document();
//载入Word文档
document.loadFromFile("本地wordw文件地址");
//以字符串形式从文档中获取文本
String text=document.getText();
//将字符串写入文本文件中
System.out.println(text);
}
3.对于网络wrod资源进行提取
package com.vts;
import com.spire.doc.Document;
import java.io.File;
import java.io.IOException;
import java.io.InputStream;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;
public class WordTestPoi {
public static void main(String[] args) throws IOException {
// 创建对象
Document document = new Document();
// 创建网络资源对象
URL url = new URL("网络资源地址");
// 打开对于资源可操作
URLConnection urlConnection = url.openConnection();
// 获取输入流对象
InputStream inputStream = urlConnection.getInputStream();
// 加载文本
document.loadText(inputStream);
// 获取文本
String text = document.getText();
System.out.println(text);
}
}