rgin-bottom="1in" margin-right="1in" margin-top="1in"/> <fo:region-before display-align="before" extent="1in" region-name="page-header"/> <fo:region-after display-align="after" extent="1in" region-name="page-footer"/> <fo:region-start extent="1in"/> <fo:region-end extent="1in"/> </fo:simple-page-master> </fo:layout-master-set> <fo:page-sequence master-reference="all-pages"> <fo:title>Hello World <fo:static-content flow-name="page-header"> <fo:block font-size="small" text-align="center" space-before="0.5in" space-before.conditionality=;"retain"> Hello World </fo:block> </fo:static-content> <fo:static-content flow-name="page-footer"> <fo:block font-size="small" text-align="center" space-after="0.5in" space-after.conditionality=quot;retain"> - <fo:page-number/> - </fo:block> </fo:static-content> <fo:flow flow-name="xsl-region-body"> <fo:block role="html:body"> <fo:block space-before="1em" space-after="1em" role="html:p"> Hello World! </fo:block> </fo:block> </fo:flow> </fo:page-sequence></fo:root>
第三步:XSL-FO到PDF
第三步,也就是最后一步,就是把XSL-FO文档传递给格式化程序来生成PDF。我用的是Apache FOP(Formatting Objects
Processor)。FOP部分实现了XSL-FO标准,并对PDF的输出格式提供了最好的支持。而对Postscript还处于初级阶段,对微软的RTF的支持还在计划中。FOP发布版包含shell脚本fop.sh/fop.bat,它们需要传入XSL-FO文件作为输入参数来生成目标PDF文件。
在Unix下可以这样运行:
fop.sh hello.fo hello.pdf
唯一所需的前提条件就是把设置为这个脚本使用到的FOP目录设置环境变量。
文件hello.pdf即为FOP的输出,你在本文的源代码中可以找到。
因为FOP目前并未完全实现XSL-FO标准,所以有一定的局限性。具体它实现了标准的哪些子集,可以在FOP的网站上的Compliance部分找到详细说明。
Java 程序
通过使用上述步骤中用过的三个工具的DOM
API,我接下来会展示一个JAVA程序。它在运行时需要提供两个命令行参数,会自动生成相应的PDF文档,并且不会产生任何临时文件。
第一个程序新建一个HTML文件的InputStream对象,然后此对象被传给JTidy。
JTidy有个方法叫parseDOM(),可以用来生成输出的XHTML文档的Document对象。
public static void main(String[] args) { // 打开文件 if (args.length != 2) { System.out.println("Usage: Html2Pdf htmlFile styleSheet"); System.exit(1); } FileInputStream input = null; String htmlFileName = args[0]; try { input = new FileInputStream(htmlFileName); } catch (java.io.FileNotFoundException e) { System.out.println("File not found: " + htmlFileName); } Tidy tidy