java 实现html模板导出pdf的方式

http://www.open-open.com/lib/view/open1341881830588.html

最近在工作中遇到了一个很囧的事情。要把HTML页面转换成PDF或者tiff图片等其他形式,目前tiff还是一头雾水,如果各位大师有真的可行的想法(不要是别人那边抄的,百度最近搜索的质量严重的打击了我对国货的信心。)希望能够告诉我,先谢了。
言归正传。所以,我就做了把HTML转换成PDF的形式。目前可以完美支持一比一转换,下面就把我的解决方案贴出来。
首先,当然是找到能够解析PDF的完美组件,百度和谷歌不约而同的告诉我们。IText是王道。而目前开源的组件中,Itext的确是一个First Choice,如果各位单纯是做把图片转成PDF或者自己写了Velocity或者FreeMarker模板生成了HTML是非常推荐直接用Itext来进行的。而如果,大家像我这样已经有前人写好了HTML页面或者懒得写FreeMarker模板的话。可以直接看下一段。
由于他们已经写好了HTML页面,而且显示已经很完美了。那我要做的就是能完美解析HTML+CSS的PDF生成工具。这时候flying-saucer进入了我的选择范围中。
http://code.google.com/p/flying-saucer/
上面是网址,这个工具托管在GoogleCode上面,作者做他们能够做下面的工作:
Flying Saucer takes XML or XHTML and applies CSS 2.1-compliant stylesheets to it, in order to render to PDF (via iText), images, and on-screen using Swing or SWT。
不难看出工作原理,就是解析XML或者XHTML并且包括css样式表,并且用Swing或者SWT的组件生成PDF的功能。这解决了页面的显示问题。IText自身的一个很严重的问题就是解析CSS有很大的问题。而这个解决了。下面就是用Flying Saucer来实现的代码:

01 public boolean convertHtmlToPdf(String inputFile, String outputFile)
02     throws Exception {
03          
04         OutputStream os = new FileOutputStream(outputFile);    
05         ITextRenderer renderer = new ITextRenderer();    
06         String url = new File(inputFile).toURI().toURL().toString();
07         
08         renderer.setDocument(url);  
09          
10         // 解决中文支持问题    
11         ITextFontResolver fontResolver = renderer.getFontResolver();   
12         fontResolver.addFont("C:/Windows/Fonts/SIMSUN.TTC", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);    
13         //解决图片的相对路径问题
14         renderer.getSharedContext().setBaseURL("file:/D:/");
15         renderer.layout();   
16         renderer.createPDF(os); 
17          
18         os.flush();
19         os.close();
20         return true;
21     }

上面这段代码是这样的,输入一个HTML地址URL = inputFile,输入一个要输出的地址,就可以在输出的PDF地址中生成这个PDF。

注意事项:

1.输入的HTML页面必须是标准的XHTML页面。页面的顶上必须是这样的格式:

1 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
2 <html xmlns="http://www.w3.org/1999/xhtml">


并且HTML页面的语法必须是非常严谨的,所有标签都必须闭合等等(由于flying-Saucer做了XML解析的工作,不严谨会报错的。),这是对页面的第一个要求。

2.要用到图片的地方写相对路径的形式,比如:

1 <img src="a.jpg" alt="323" width="252" height="80" />

而它的图片位置则必须在Java代码中指定。

renderer.getSharedContext().setBaseURL("file:/D:/");

也有另一种方法就是直接在<img>标签中写绝对路径。

3.Flying-Saucer在解析tiff格式的图片的时候会报错。具体原因我还没找到。希望大家能够指点我。

4.如果在页面中有中文字体的话。必须在HTML代码中的样式中写上某种字体的css,并且必须是用英文的,然后在Java代码中写上对应的文件位置。

ITextFontResolver fontResolver = renderer.getFontResolver();

           fontResolver.addFont("C:/Windows/Fonts/SIMSUN.TTC", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);

上面的方法是添加了宋体。也可以添加其他字体。

以上就是解决方案。

下面给出这几个包的下载地址。大家可以直接下载。


下载地址,猛点我吧!

http://blog.sina.com.cn/s/blog_59d6717c0100p7xr.html   一个现成的例子,可能跟更加 简单明了


http://huangronaldo.iteye.com/blog/1555917  资料比较全面


  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PDF模板导出可以使用Java的iText库来实现。iText是一个开源的Java库,可以用来创建、编辑和操作PDF文档。下面是一个简单的示例代码,演示了如何使用iText来导出PDF模板: ``` import com.itextpdf.text.Document; import com.itextpdf.text.DocumentException; import com.itextpdf.text.Rectangle; import com.itextpdf.text.pdf.PdfReader; import com.itextpdf.text.pdf.PdfStamper; import java.io.FileOutputStream; import java.io.IOException; public class PdfTemplateExporter { public static void main(String[] args) throws IOException, DocumentException { // 读取PDF模板文件 PdfReader reader = new PdfReader("template.pdf"); // 创建输出文件 FileOutputStream out = new FileOutputStream("output.pdf"); // 创建PDF文档对象 Document document = new Document(); // 创建PDF输出流 PdfStamper stamper = new PdfStamper(reader, out); // 获取PDF文档的页面数 int pages = reader.getNumberOfPages(); // 遍历所有页面 for (int i = 1; i <= pages; i++) { // 获取当前页面的可编辑区域 Rectangle rect = reader.getCropBox(i); // 在可编辑区域内添加内容(这里可以添加表格、文本、图片等) // ... // 更新页面内容 stamper.getOverContent(i).setLiteral("Q\nq\n"); // 释放资源 stamper.close(); } // 关闭PDF输出流 out.close(); } } ``` 在这个示例中,我们首先读取了一个名为“template.pdf”的PDF模板文件。然后,我们创建了一个名为“output.pdf”的输出文件,并创建了一个PDF文档对象和一个PDF输出流。接下来,我们遍历了所有页面,获取了每个页面的可编辑区域,并在可编辑区域内添加了一些内容。最后,我们更新了页面内容,关闭了PDF输出流。 当你运行这个示例代码时,它将从“template.pdf”文件中读取PDF模板,并在每个页面上添加一些内容。然后,它将生成一个名为“output.pdf”的新PDF文件,其中包含了我们添加的内容。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值