java 实现word 转PDF （采用第三方技术 IText、Poi、Jsoup）

最新推荐文章于 2024-08-21 09:47:17 发布

小凯哥哥

最新推荐文章于 2024-08-21 09:47:17 发布

阅读量3.3w

点赞数 6

文章标签： poi word pdf

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zk_spring/article/details/43412221

版权

先讲讲思路：

第一步：使用 poi 将word转换成 html，这里代码一搜一堆没什么好说的，千篇一律。

（值得注意的地方是IText 根据html生成pdf文件的时候，会验证html文件是否标准，例如通过poi转换的出来的html文件的一些标签会缺少标签闭合 ” / “ :

举个栗子：

<html>
<head>
<META http-equiv="Content-Type" content="text/html; charset=UTF-8">

<img src="test/0.jpg" style="width:5.765972in;height:8.647917in;vertical-align:text-bottom;">

这是我直接用pio生成的html中的一部分, META、img 标签明显就没有对应闭合标签。如果用这种html进行转换是没有办法通过itext 的校验的。会出现以下异常

错误： “The element type "meta" must be terminated by the matching end-tag "</meta>".”
org.xhtmlrenderer.util.XRRuntimeException: Can't load the XML resource (using TRaX transformer). org.xml.sax.SAXParseException: The element type "meta" must be terminated by the matching end-tag "</meta>". 。

从错误分析也知道是我们的html不规范拉，我们采用第三方 jar 包Jsoupÿ

最低0.47元/天解锁文章

关注

6
点赞
踩
34

收藏

觉得还不错? 一键收藏
44
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 44

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。