itext7 html2pdf 将html文本转为pdf

1、将html转为pdf需求分析

经常会看到爬虫有这样的需求,将某一个网站上的数据,获取到了以后,进行分析,然后将需要的数据进行存储,也有将html转为pdf进行存储,作为原始存档,当然这里看具体的需求,可能有些不需要。

2、这里的itext7是pdf的工具,有一个html2pdf包,可以将html转为pdf,这里面可以是一段html文本也可以是一个html文件,这个根据不同的情况,我们可以通过不同的参数去实现。

通过图中我们可以知道,方法里的参数形式还是很丰富的。

3、引入依赖包pom.xml

<!-- iText7 Core -->
		<dependency>
			<groupId>com.itextpdf</groupId>
			<artifactId>itext7-core</artifactId>
			<version>7.1.16</version>
			<type>pom</type>
		</dependency>
		<!-- HTML to PDF Add-On -->
		<dependency>
			<groupId>com.itextpdf</groupId>
			<artifactId>html2pdf</artifactId>
			<version>3.0.4</version>
		</dependency>

4、编写测试类HtmlToPdfConverter

/**

@date: 2025年4月14日
@author: 花花鱼
@filename: HtmlToPdfConverter.java
@func: 测试html文件生成pdf文件
*/
package com.example.utils;

import com.itextpdf.html2pdf.HtmlConverter;
import com.itextpdf.kernel.pdf.PdfWriter;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
 
public class HtmlToPdfConverter {
    public static void main(String[] args) {
        // HTML内容
        String htmlContent = "<h1>Hello, World!</h1><p>This is a paragraph.</p>";
        // 输出PDF文件的路径
        String dest = "output.pdf";
        
        try {
            // 创建PdfWriter实例用于写入PDF文件
        	File file = new File(dest);
        	System.out.println(file.getAbsoluteFile().toString());
            PdfWriter writer = new PdfWriter(new FileOutputStream(new File(dest)));
            // 创建PdfDocument实例
//            PdfDocument pdf = new PdfDocument(writer);
            // 使用HtmlConverter将HTML转换为PDF
            HtmlConverter.convertToPdf(htmlContent, writer);
            // 关闭文档
//            pdf.close();
            writer.close();
            System.out.println("PDF created successfully!");
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

一个简单的html转为pdf文件就生成了,特别地:如果html比较复杂的话,可能需要进行额外的处理,这里是简单的测试, 更多功能待你去发掘。

1、解决中文问题 2、附字体 3、动态html拼接pdf public static void htmlCodeComeString(String linkcss,String htmlCode, String outputFile,String title) throws Exception { OutputStream os = new FileOutputStream(outputFile); ITextRenderer renderer = new ITextRenderer(); renderer.setDocumentFromString(getConversionHtmlCode(linkcss,htmlCode,title)); ITextFontResolver fontResolver = renderer.getFontResolver(); URL fontPath = ItextUtil.class.getResource("simsun.ttc"); fontResolver.addFont(fontPath.toString(), BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED); // 解决图片的相对路径问题 // renderer.getSharedContext().setBaseURL("file:/F:/teste/html/"); renderer.layout(); renderer.createPDF(os); System.out.println("======换成功!"); os.close(); os.flush(); } public static void main(String[] args) { ItextUtil itextUtil = new ItextUtil(); String html = ""; html += ""; html += "企业信息"; html += " "; html += " "; html += " 登记日期"; html += " 2006-04-28"; html += " "; html += " "; html += " 纳税人编号"; html += " HSJIHKS002"; html += " "; html += " "; html += " 有效标志"; html += " Y"; html += " "; html += " "; html += " 社会信用代码"; html += " 916101317H"; html += " "; html += " "; html += " 评估机关代码"; html += " 盛世"; html += " "; html += " "; html += " 工商注销日期"; html += " 2006-04-28"; html += " "; html += " "; html += ""; String outputFile = "D:\\pdf\\aa.pdf"; try { itextUtil.htmlCodeComeString("",html,outputFile,""); } catch (Exception e) { // TODO Auto-generated catch block e.printStackTrace(); } System.out.println("生成结束!!!"); }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值