依赖
<!-- pdf依赖-->
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>pdfbox</artifactId>
<version>1.8.10</version>
</dependency>
注:版本过高可能会导致部分代码工具类被替换 需要子调整合适的版本依赖
dome
package com.example.demo;
import java.io.File;
import java.io.FileWriter;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDDocumentInformation;
import org.apache.pdfbox.util.PDFTextStripper;
public class PdfToDoc {
public static void main(String[] args) throws Exception {
//将 PDF 文件读入 PDDocument
File file = new File("C:\\Users\\Administrator\\Desktop\\PDF2.pdf");
PDDocument document = PDDocument.load(file);
//获取PDDocumentInformation
PDDocumentInformation pdd = document.getDocumentInformation();
//获取页数
int pages = document.getNumberOfPages();
//使用 PDFTextStripper 提取文本
PDFTextStripper stripper = new PDFTextStripper();
//设置转换的页数
stripper.setStartPage(1);
stripper.setEndPage(pages);
//获取文本
String content = stripper.getText(document);
//关闭文件
document.close();
//将文本写入Doc文件
File docFile = new File("C:\\Users\\Administrator\\Desktop\\pdf2.doc");
FileWriter writer = new FileWriter(docFile);
writer.write(content);
writer.close();
System.out.println("end>>>>>>>>>>>>>>>>>>>");
}
}