Java将html转换PDF文件

Java HTML转换为PDF文件

1.场景描述

公司业务中需要将富文本编辑器保存的HTML格式文件转换成PDF文件供前端预览、下载及打印,因为富文本编辑器中,HTML的格式不太规范,并且样式比较多,Java基于IText对HTML文件进行转换对格式要求较为严格,并且转换样式可能出现问题,所以选用了基于WKHtmlToPdf的方式进行文档的转换。

WKHtmlToPdf是一个使用 WebKit 网页渲染引擎开发的用来将 HTML 文档转成 PDF 文档的工具,可以跟多种脚本语言进行集成来转换文档。官方网站:https://wkhtmltopdf.org/

2.使用准备

安装WKHtmlToPdf

下载网站:https://wkhtmltopdf.org/downloads.html

选择适合的版本安装(win11版本可能不兼容)
在这里插入图片描述

Linux安装

下载对应系统的rpm包到Linux环境中,到rpm包的目录下

rpm -ivh wkhtmltox-0.12.6-1.centos7.x86_64.rpm

可能出现安装失败,此时需要安装依赖的字体文件
在这里插入图片描述
执行安装依赖字体后再安装wkhtmltopdf

yum install xorg-x11-fonts-75dpi.noarch

安装后程序默认目录在 /usr/local/bin/wkhtmltopdf

3.测试转换

/usr/local/bin/wkhtmltopdf /test.html /test.pdf

软件安装目录 源html目录 目标pdf目录
在这里插入图片描述
转换成功!

4.整合Java

  /**
   * 
   * @param html 要转换的html字符串
   * @param fileName 输出的pdf路径 如C://test.pdf
   * @return
   * @throws IOException
   */
public File html2PDF(String html,String fileName) throws IOException {
    	//指定转换的html文件目录
        File target = new File("C:\\test.html");
    	//指定WKHTMLTOPDF安装目录	
    	String wkhtmlToPdfPath = "D:\\Program Files\\wkhtmltopdf\\bin\\wkhtmltopdf";
        //父目录不存在则创建
        if(!target.getParentFile().exists()){
            target.getParentFile().mkdir();
        }
        //读取html字符串 将html字符串转换为html文件
        PrintWriter printWriter = new PrintWriter(new FileWriter(target));
        printWriter.println(html);
        printWriter.close();
				//转换后的PDF文件路径
				File transferPDF = new File(fileName);

        //编写转换cmd命令
        StringBuilder cmd = new StringBuilder();
        cmd.append(wkhtmlToPdfPath);
        //添加页眉 页码 页眉下的线
        cmd.append(" --header-right 'TERMS & CONDITIONS' --header-line ");
        //设置页眉和内容的距离,默认0
        cmd.append(" --header-spacing 5 ");
        //在页脚右边放置页码
        cmd.append(" --footer-right [page]/[toPage] --footer-line ");
		//拼接要转换的html文件路径
        cmd.append(target.getAbsolutePath());
        cmd.append(" ");
        cmd.append(fileName);
        System.out.println(cmd.toString());
        boolean result = true;
        Process proc = null;
        try {
            //执行cmd命令
            proc = Runtime.getRuntime().exec(cmd.toString());
            proc.waitFor();
        } catch (Exception e) {
            result = false;
            log.error("转换失败!",e);
        } finally {
            proc.destroy();
        }
        return transferPDF;
    }
  • 1
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
可以使用开源的Java库iText来将HTML文件转换PDF。具体实现步骤如下: 1. 首先,需要引入iText库。可以通过Maven或手动下载jar包的方式引入。 2. 使用iText中的PdfWriter类创建一个新的PDF文件。 ```java Document document = new Document(); PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream(outputFile)); document.open(); ``` 3. 使用iText中的XMLWorkerHelper类将HTML文件转换PDF。 ```java // 读取HTML文件 String html = FileUtils.readFileToString(new File(htmlFile), "UTF-8"); // 创建字体 XMLWorkerFontProvider fontProvider = new XMLWorkerFontProvider(); fontProvider.register("fonts/simhei.ttf"); // 将HTML转换PDF XMLWorkerHelper.getInstance().parseXHtml(writer, document, new ByteArrayInputStream(html.getBytes()), null, Charset.forName("UTF-8"), fontProvider); ``` 4. 最后,关闭文件流并保存PDF文件。 ```java document.close(); writer.close(); ``` 完整的代码示例: ```java import com.itextpdf.text.Document; import com.itextpdf.text.pdf.PdfWriter; import com.itextpdf.tool.xml.XMLWorkerFontProvider; import com.itextpdf.tool.xml.XMLWorkerHelper; import org.apache.commons.io.FileUtils; import java.io.ByteArrayInputStream; import java.io.File; import java.io.FileOutputStream; import java.nio.charset.Charset; public class HtmlToPdfConverter { public static void main(String[] args) throws Exception { String htmlFile = "input.html"; // HTML文件路径 String outputFile = "output.pdf"; // PDF文件路径 Document document = new Document(); PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream(outputFile)); document.open(); // 读取HTML文件 String html = FileUtils.readFileToString(new File(htmlFile), "UTF-8"); // 创建字体 XMLWorkerFontProvider fontProvider = new XMLWorkerFontProvider(); fontProvider.register("fonts/simhei.ttf"); // 将HTML转换PDF XMLWorkerHelper.getInstance().parseXHtml(writer, document, new ByteArrayInputStream(html.getBytes()), null, Charset.forName("UTF-8"), fontProvider); document.close(); writer.close(); } } ``` 注意:在转换HTML文件时,需要注意HTML中的CSS样式和图片等外部资源的引用路径。同时,iText对HTML的解析有一定限制,不支持所有的HTML标签和CSS样式,需要根据具体情况进行调整。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值