java itext html转pdf[续篇]


之前利用itext进行html转pdf,实际使用中还是有些地方确实需要注意的,我所遇到的归纳以下几个问题:

1,中文的支持

2,html格式要求严格

3,pdf里面文字换行问题


第一个中文支持呢,我看就通过:

 ITextRenderer renderer = new ITextRenderer();  
        ITextFontResolver font = renderer.getFontResolver(); 
 font.addFont("C:/WINDOWS/Fonts/simsun.ttc",  
                    BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED); 

就差不多了,其实有个疑问的,就一种字体?多添加几种字体都不行

这样加了还不行的,html文档里面还就只能设定这个字体,设了其他字体就不行了,这个比较郁闷。

这就还正好牵到第二个问题,html格式非常非常严格,有丁点的不对的地儿就报错,这个更郁闷。

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<style>
body{
font-family:SimSun;
font-size:14px;
}
</style>
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8"></meta>

贴出我html一段代码,下面拼下head,body就ok,注意一定要配对,这个html最上面还多了个xml定义,开始是遇到html.version错,一直没找到原因,就google了下,有用的消息不是很多,因为有的人不需要这个也没关系,但是我这就是错,查了官网,看到demo上面多了个xml定义,才copy过来看看,还真是这样的错,又一个郁闷的地儿。

至于第三个问题,哎呀妈呀,愣是被折磨了两天,想尽各种办法,没辙。。。。

google,baidu都没找到合理的解释,大家很少遇到这个原因,我想因为,大多数生成pdf应该是基于模板生成什么报表之类的,都是出来个表格之类的,没遇到输出大量文字信息,就比如下面一段html:

<body>
 <table style="margin-top: 120px;table-layout:fixed; word-break:break-strict;">
    <tbody>
  		<tr>
    		<td>
    		 <b>新华社中国网事:【莫言:诺贝尔奖金将用来买房】巨额奖金怎么用?</b><br/>刚刚获得诺贝尔文学奖的莫言在接受新华社中国网事记者专访时笑着说:“我准备在北京买套房子,大房子,后来有人提醒我说也买不了多大的房子,5万多一平米,750万也就是120多平米。”
      		</td>
	    </tr>
    </tbody>
</table>
</body>

body中有个table,就一行文字,但是呢,一行非常长的文字,没有换行,这样输出的pdf就会把表格撑开,一行显示,pdf就显示不全这些文字,就是这个问题,把我搞死了,还好不断的摸索,尝试,google,终于网上有哥们给出解决办法,给出链接:【他解决问题还是蛮多的,顶起 http://blog.csdn.net/shanliangliuxing/article/details/6833471】原来是itext源码问题,完全忽略咱强大的china的存在,他源码换行是按照空格换行,老外嘛,单词之间空格表示,咱中文不行啊,所以果断修改源码,感谢哥们提供下载,我试过了,没有问题的

这样用需要有CSS配合,上面table中

table-layout:fixed; word-break:break-strict;

要加上。


最后满足自己一下私心,做的一个站点,大家有兴趣可以帮忙点击一下,猛戳这里

### 回答1: 以下是使用iText库将HTML换为PDFJava示例代码: ```java import java.io.*; import com.itextpdf.text.*; import com.itextpdf.text.pdf.*; import com.itextpdf.tool.xml.*; import com.itextpdf.tool.xml.pipeline.*; import com.itextpdf.tool.xml.pipeline.html.*; import com.itextpdf.tool.xml.pipeline.end.*; public class HtmlToPdfConverter { public static void main(String[] args) throws Exception { String inputFile = "input.html"; String outputFile = "output.pdf"; // 创建PDF文档对象 Document document = new Document(); PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream(outputFile)); document.open(); // 为HTML内容创建阅读器 XMLWorkerHelper worker = XMLWorkerHelper.getInstance(); InputStream is = new FileInputStream(inputFile); // 获取字体文件,用于支持HTML中的中文 XMLWorkerFontProvider fontProvider = new XMLWorkerFontProvider(); fontProvider.register("fonts/simhei.ttf"); // 创建HTML阅读器管道 CssAppliers cssAppliers = new CssAppliersImpl(fontProvider); HtmlPipelineContext htmlContext = new HtmlPipelineContext(cssAppliers); htmlContext.setTagFactory(Tags.getHtmlTagProcessorFactory()); htmlContext.setImageProvider(new AbstractImageProvider() { public String getImageRootPath() { return "C:/images/"; } }); Pipeline<?> pipeline = new CssResolverPipeline(new StyleAttrCSSResolver(), new HtmlPipeline(htmlContext, new PdfWriterPipeline(document, writer))); XMLWorker worker = new XMLWorker(pipeline, true); XMLParser p = new XMLParser(worker); p.parse(is); // 关闭文档 document.close(); writer.close(); } } ``` 上述代码使用了iText的XMLWorkerHelper类,该类可将HTML换为PDF。在这个例子中,我们创建了一个名为`HtmlToPdfConverter`的Java类,它读取名为`input.html`的HTML文件,并将其换为名为`output.pdf`的PDF文件。 注意,上述代码需要iText库的支持,因此您需要在Java项目中导入iText库。同时,您还需要将字体文件和图像文件放在正确的位置,以便iText能够正确地渲染HTML内容。 ### 回答2: Java iText 是一个开源的工具包,用于将 HTML 换为 PDF 格式。下面是一个简单的示例代码: ```java import com.itextpdf.text.Document; import com.itextpdf.text.DocumentException; import com.itextpdf.text.html.simpleparser.HTMLWorker; import com.itextpdf.text.pdf.PdfWriter; import java.io.*; public class HtmlToPdfConverter { public static void main(String[] args) { String htmlContent = "<html><body><h1>Hello PDF</h1></body></html>"; String pdfFile = "output.pdf"; try { // 创建文档对象和 PDF 写入器 Document document = new Document(); PdfWriter.getInstance(document, new FileOutputStream(pdfFile)); document.open(); // 将 HTML 内容换为 PDF HTMLWorker htmlWorker = new HTMLWorker(document); htmlWorker.parse(new StringReader(htmlContent)); // 关闭文档 document.close(); System.out.println("PDF 换成功!"); } catch (DocumentException | IOException e) { e.printStackTrace(); } } } ``` 以上代码创建了一个包含简单 HTML 内容的字符串变量 `htmlContent`,并将其换为 PDF 格式,输出到名为 `output.pdf` 的文件中。您可以将 `htmlContent` 替换为您想要换的实际 HTML 代码,并将 `output.pdf` 替换为您要输出的 PDF 文件的路径。需要注意的是,如果 HTML 中包含 CSS 样式或图像等内容,可能需要进行额外的处理。 ### 回答3: Java itext htmlPDF代码可以通过以下步骤实现: 1. 导入必要的itext库文件,确保项目中已经引入了相关的依赖。 2. 创建一个Document对象,用于写入PDF内容。 3. 创建一个PdfWriter对象,将Document对象与PdfWriter对象相关联,以便将内容写入PDF。 4. 使用HTMLWorker类将HTML内容换为PDF格式。 5. 打开Document对象,开始写入PDF内容。 6. 使用HTMLWorker的parse方法将HTML内容解析为Document对象可以识别的元素。 7. 关闭Document对象,结束写入PDF。 下面是一个简单的示例代码: ```java // 导入必要的库文件 import com.itextpdf.text.Document; import com.itextpdf.text.DocumentException; import com.itextpdf.text.pdf.PdfWriter; import com.itextpdf.text.html.simpleparser.HTMLWorker; import java.io.FileOutputStream; import java.io.IOException; import java.io.StringReader; public class HtmlToPdfConverter { public static void main(String[] args) { // 原始HTML内容 String htmlContent = "<html><body><h1>Hello, World!</h1></body></html>"; // 创建Document对象 Document document = new Document(); try { // 创建PdfWriter对象,并将Document对象与PdfWriter对象关联 PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream("output.pdf")); // 打开Document对象 document.open(); // 解析HTML内容并写入PDF HTMLWorker htmlWorker = new HTMLWorker(document); htmlWorker.parse(new StringReader(htmlContent)); // 关闭Document对象 document.close(); } catch (DocumentException | IOException e) { e.printStackTrace(); } } } ``` 以上代码会将原始的HTML内容换为PDF,并保存为名为output.pdf的文件。
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值