JAVA将PDF文件转为WORD

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStreamWriter;
import java.io.Writer;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;

public class Pdf2word
{
public static void main(String[] args)
{
try
{
String pdfFile = "C:/xxxxx.pdf";
PDDocument doc = PDDocument.load(new File(pdfFile));
int pagenumber = doc.getNumberOfPages();
pdfFile = pdfFile.substring(0, pdfFile.lastIndexOf("."));
String fileName = pdfFile + ".doc";
File file = new File(fileName);
if (!file.exists())
{
file.createNewFile();
}
FileOutputStream fos = new FileOutputStream(fileName);
Writer writer = new OutputStreamWriter(fos, "UTF-8");
PDFTextStripper stripper = new PDFTextStripper();
stripper.setSortByPosition(true);// 排序
stripper.setStartPage(1);// 设置转换的开始页
stripper.setEndPage(pagenumber);// 设置转换的结束页
stripper.writeText(doc, writer);
writer.close();
doc.close();
System.out.println("pdf转换word成功!");
}
catch (IOException e)
{
e.printStackTrace();
}
}
}

涉及jar包 pdfbox-1.8.2.jar 可在 http://www.java2s.com/Code/Jar/p/Downloadpdfbox182jar.htm 下载

Java中,将Word文档换为PDF通常需要借助第三方库,因为标准Java API并不直接支持这种换。Apache POI是一个常用的处理Microsoft Office格式(如Word)的库,但它本身并不支持直接生成PDF。你可以结合其他工具或服务来完成这个任务。 一个常见的做法是先读取Word文档内容,然后使用像iText、Aspose.Words或者docx4j这样的专门用于WordPDF换的库。以下是使用iText的一个简单示例: ```java import com.itextpdf.text.Document; import com.itextpdf.text.Paragraph; import com.itextpdf.text.pdf.PdfWriter; import java.io.FileOutputStream; import java.io.IOException; public class WordToPdf { public static void main(String[] args) { try { // 创建一个新的Document对象 Document document = new Document(); // 打开Word文件并读取内容 // 这部分代码取决于你如何从Word获取数据,可以使用POI或者其他库 String wordContent = readWordFile("input.docx"); // 将Word内容添加到PDF中 document.add(new Paragraph(wordContent)); // 写入PDF文件 PdfWriter.getInstance(document, new FileOutputStream("output.pdf")); document.open(); document.close(); // 关闭PDF文档 } catch (Exception e) { e.printStackTrace(); } } private static String readWordFile(String fileName) throws IOException { // 使用Apache POI或其他库读取Word内容,并返回字符串形式的内容 // 这部分代码需要你自己实现 return ""; } } ``` 请注意,这只是一个基本的示例,实际过程中可能需要处理更复杂的结构和格式。同时,将Word文件内容手动拼接到PDF里可能无法保留原始格式,如果需要保持原样,建议选择专门针对此目的的工具或服务,如Apache PDFBox或者商业解决方案。
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值