docx java 图片_java解析docx文档提取文字和图片

最新推荐文章于 2023-08-03 16:29:23 发布

sarahrnagy

最新推荐文章于 2023-08-03 16:29:23 发布

阅读量211

点赞数

文章标签： docx java 图片

本文链接：https://blog.csdn.net/weixin_28957519/article/details/114097318

版权

本文提供了使用Java解析docx文档并提取文字和图片的方法。通过XWPFWordExtractor获取文档文字，并使用XWPFDocument的getAllPictures方法获取所有图片，将文字保存为txt文件，图片保存到本地。

摘要由CSDN通过智能技术生成

直接上代码

fr.opensagres.xdocreport

org.apache.poi.xwpf.converter.pdf

1.0.6

package docxAnalyze;

import java.io.*;

import java.util.List;

import org.apache.poi.xwpf.extractor.XWPFWordExtractor;

import org.apache.poi.xwpf.usermodel.XWPFDocument;

import org.apache.poi.xwpf.usermodel.XWPFPictureData;

public class Word {

public static String textPath = "src/main/resources/test.txt";

public static String docPath = "src/main/resources/test.docx";

public static String imagePath = "src/main/resources/test.docx";

public static void main(String args[]) {

readDocxTextAndImage();

}

public static String readDocxTextAndImage() {

File file = new File(docPath);

try {

// 用XWPFWordExtractor来获取文字

FileInputStream fis &#

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注