Word通过poi-ooxml生成PDF(一)

本文讲述了作者在接手一个合同生成项目时,遇到手动转换Word为HTML并生成PDF的问题,由于HTML标签未闭合导致错误。作者发现了一个HTML标签校验器,并决定采用poi-ooxml库直接从Word生成PDF,避免了手动转换和可能的错误,实现了更高效的工作流程。
摘要由CSDN通过智能技术生成

生成PDF的前世今生

之前楼主刚刚接手一个老项目,大致内容是负责合同的生成。毕竟说楼主发量还是挺足的,于是在接手之后楼主噼里啪啦一顿操作,修改文件,上传,生成……

呵呵,运气真好,第一驳操作就报错了。

项目中PDF的生成步骤大致是:

  1. 手动将Word文件转为HTML
  2. 维护生成后HTML,如写入变量等等
  3. 上传HTML文件到系统中,之后通过freemarker进行渲染生成PDF合同文件

总的来说,以上步骤并没有任何的毛病,最多就是废手和眼,因为给楼主的报错信息是有一个标签没有闭合!

淦!

几千行HTML文件中一个标签没有闭合,鬼知道哪个标签没有闭合,况且就算标签没有闭合浏览器依然可以渲染出来。

不过这并难不倒我,毕竟我发量贼足。

楼主仗着5.2的视力将HTML文件逐行看了个遍,然而,依然没有看出来究竟是哪个标签没有闭合!!!

再后来,脑袋一拍干脆百度搜一个HTML标签校验器,把文件复制一份上去检测一下,大意了,早知道有这玩意,我还找个P啊。

所以这个故事告诉我们,手动将Word转HTML,生成PDF究竟有多蛋疼!

为了避免因为标签没有闭合而导致freemarker渲染失败,楼主果断换一种生成方式,也就是使用poi-ooxml来生成。

准备工作

撸代码之前先添加一波依赖

<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-ooxml</artifactId>
    <version>3.14</version>
</dependency>
<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-scratchpad</artifactId>
    <version>3.14</version>
</dependency>
<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi</artifactId>
    <version>3.14</version>
</dependency>
<dependency>
    <groupId>
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值