java html转pdf 无法支持中文_java项目实现html转pdf的需求（支持中文和CSS样式）

Monicaf

于 2021-02-16 04:30:21 发布

阅读量913

点赞数

文章标签： java html转pdf 无法支持中文

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42237487/article/details/114192090

版权

本文介绍了如何在Java项目中实现HTML转PDF，并解决中文支持和CSS样式的问题。通过添加特定字体样式，修改核心jar包，以及使用Jsoup进行HTML预处理，确保转换过程的正确性。此外，还提供了处理图片Base64编码的解决方案，但遇到图片跨页截断的bug，目前尚未找到解决方法。

摘要由CSDN通过智能技术生成

java项目中用到了html转pdf的需求，现在写一个自己认为最优方案的总结，虽然还是有一些小的bug

为了保证中文的支持需要在被转换的html添加body的添加中文字体样式,保持这个字体和后边转换pdf的字体一致就可以了，不需要必须是SimSun字体

body{

font-family:SimSun;

}

下面放上jar包的引用pom

注意：org.xhtmlrenderer.core-renderer.R8的jar包，其实需要做一些修改，直接用的话不支持中文换行，可以点击下载支持中文换行的jar包，修改jar包名字替掉R8的jar包

org.xhtmlrenderer

core-renderer

R8

org.apache.commons

commons-lang3

3.0

com.itextpdf

itextpdf

5.5.10

com.itextpdf

html2pdf

2.0.0

这种方式对html里的代码样式要求比较严格，类似xhtml的标准，要求html中的标签都是闭合的，像meta和link这样的标签以及空格&nbsp；这类的转义符都会导致转换pdf报错，因此最好在之前将html代码进行处理，以下是处理代码：

import java.io.File;

import java.io.FileInputStream;

import com.itextpdf.html2pdf.jsoup.Jsoup;

import com.itextpdf.html2pdf.jsoup.nodes.Document;

import com.itextpdf.html2pdf.jsoup.nodes.Entities;

public class HtmlToXHtmlJsoup {

public static String html2xhtml(String html) {

Document doc = Jsoup.parse(html);

doc.outputSettings().syntax(Document.OutputSettings.Syntax.xml).escapeMode(Entities.EscapeMode.xhtml);

return doc.html();

}

public static void main(String[] args) throws Exception {

// File file = new File("E:\\html2xhtml.html");

File file = new File("report01.html");

FileInputStream input = new FileInputStream(file);

int size = input.available();

byte[] buff = new byte[size];

input.read(buff);

input.close();

String html = new String(buff, "utf-8");

System.out.println("============html===========

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。