java pdf 转word源码_java将pdf文件转为word

这篇博客展示了如何使用Apache PDFBox库将PDF文件转换为Word文档。通过加载PDF,创建新文件,然后利用PDFTextStripper将PDF内容写入Word,实现了转换过程。转换时可以设置开始和结束页,以及排序选项。所需的pdfbox-1.8.2.jar库可以在指定链接下载。
摘要由CSDN通过智能技术生成

import java.io.File;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.OutputStreamWriter;

import java.io.Writer;

import org.apache.pdfbox.pdmodel.PDDocument;

import org.apache.pdfbox.util.PDFTextStripper;

public class Pdf2word

{

public static void main(String[] args)

{

try

{

String pdfFile = "C:/xxxxx.pdf";

PDDocument doc = PDDocument.load(new File(pdfFile));

int pagenumber = doc.getNumberOfPages();

pdfFile = pdfFile.substring(0, pdfFile.lastIndexOf("."));

String fileName = pdfFile + ".doc";

File file = new File(fileName);

if (!file.exists())

{

file.createNewFile();

}

FileOutputStream fos = new FileOutputStream(fileName);

Writer writer = new OutputStreamWriter(fos, "UTF-8");

PDFTextStripper stripper = new PDFTextStripper();

stripper.setSortByPosition(true);// 排序

stripper.setStartPage(1);// 设置转换的开始页

stripper.setEndPage(pagenumber);// 设置转换的结束页

stripper.writeText(doc, writer);

writer.close();

doc.close();

System.out.println("pdf转换word成功!");

}

catch (IOException e)

{

e.printStackTrace();

}

}

}

涉及jar包 pdfbox-1.8.2.jar 可在 http://www.java2s.com/Code/Jar/p/Downloadpdfbox182jar.htm 下载

内容来源于网络如有侵权请私信删除

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值