java转pdf_java 实现word 转PDF (采用第三方技术 IText、Poi、Jsoup)

先讲讲思路:

第一步:使用 poi 将word转换成 html,这里代码一搜一堆没什么好说的千篇一律。

(值得注意的地方是IText 根据html生成文件的是否会验证html文件是否标准,例如通过poi转换的出来的html文件的一些标签会缺少标签闭合 ,

举个例子:

0.jpg

这是我直接用poi生成的html中的一部分, META、img 标签明显就没有闭合标签。如果用这种html进行转换是没有办法通过itext 的校验的。会出现以下异常

错误:        “The element type "meta" must be terminated by the matching end-tag "".”

org.xhtmlrenderer.util.XRRuntimeException: Can't load the XML resource (using TRaX transformer). org.xml.sax.SAXParseException: The element type "meta" must be terminated by the matching end-tag "".  。

从错误分析也知道是我们的html不规范拉,我们采用第三方 jar 包  Jsoup,  直接调用parse方法 我们的html就标准啦!

因为遇到这个问题让我头疼了半天,没想到就这么轻松的解决了,发个博文支援一下遇到该问题的小伙伴们 !

下面是poi转换html 的代码:

package com.smart.sys.core.service.io.poi;

import org.apache.poi.hwpf.HWPFDocument;

import org.apache.poi.hwpf.converter.PicturesManager;

import org.apache.poi.hwpf.converter.WordToHtmlConverter;

import org.apache.poi.hwpf.usermodel.Picture;

import org.apache.poi.hwpf.usermodel.PictureType;

import org.jsoup.Jsoup;

import org.w3c.dom.Document;

import javax.xml.parsers.DocumentBuilderFactory;

import javax.xml.parsers.ParserConfigurationE

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Java7可以使用POIiText库将Word文档换为PDF格式。 首先,你需要引入POI库和iText库到你的项目中,并在代码中进行相关的调用。 使用POI库读取Word文档内容,并将其换为iText库中的Document对象。然后,使用iText库中的PdfWriter将Document对象换为PDF文件。 下面是一个简单的示例代码片段: ```java import java.io.FileInputStream; import java.io.FileOutputStream; import org.apache.poi.xwpf.usermodel.XWPFDocument; import com.itextpdf.text.Document; import com.itextpdf.text.Paragraph; import com.itextpdf.text.pdf.PdfWriter; public class WordToPDFConverter { public static void main(String[] args) { try { // 读取Word文档 XWPFDocument document = new XWPFDocument(new FileInputStream("input.docx")); // 创建PDF文档 Document pdfDoc = new Document(); PdfWriter.getInstance(pdfDoc, new FileOutputStream("output.pdf")); pdfDoc.open(); // 逐段读取Word文档内容,并添加到PDF文档中 for (XWPFParagraph paragraph : document.getParagraphs()) { String text = paragraph.getText(); pdfDoc.add(new Paragraph(text)); } // 关闭文档 pdfDoc.close(); document.close(); System.out.println("Word文档成功换为PDF文件!"); } catch (Exception e) { e.printStackTrace(); } } } ``` 上述代码中,我们使用POI库的XWPFDocument来读取Word文档,然后使用iText库的Document和PdfWriter将内容写入PDF文件。 请注意,这只是一个简单的示例代码。如果Word文档包含更复杂的格式或元素(如图片、表格等),则需要进行更详细的处理。 希望这个回答对你有帮助!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值