package test;
import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStreamWriter;
import java.io.Writer;
import java.util.List;
import org.apache.pdfbox.multipdf.Splitter;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;
import org.junit.Test;
public class PDFToWord {
/**
* 第一版
* 只是转换文字
*/
@Test
public void pdfToWordOfText(){
try {
//pdf文件路径
String filePath = "C:/Users/Administrator/Desktop/测试1.pdf";
File fdf = new File(filePath);
//生成的word的文件路径
String wordPath = "C:/Users/Administrator/Desktop/测试1.doc";
//通过文件名加载文档
PDDocument doc = PDDocument.load(fdf);
//获取文档的页数
int pageNumber = doc.getNumberOfPages();
//剥离器(读取pdf文件)
PDFTextStripper stripper = new PDFTextStripper();
//排序
stripper.setSortByPosition(true);
//设置要读取的起始页码
stripper.setStartPage(1);
//设置要读取的结束页码
PDFBOX操作pdf文件,pdf转word,pdf分割
最新推荐文章于 2024-08-02 10:35:25 发布
本文详细介绍了如何使用PDFBOX库进行PDF文件的操作,包括将PDF转换为Word文档以及对PDF进行分割的步骤和技巧,帮助读者掌握PDF文件的处理技术。
摘要由CSDN通过智能技术生成