html转换为pdf的关键技术是如何处理网页中复杂的css样式、以及中文乱码处理。
各实现对比表
于Windows平台进行测试:
|
基于IText |
基于FlyingSaucer |
基于WKHtmlToPdf |
基于pd4ml |
|
跨平台性 |
跨平台 |
跨平台 |
跨平台 |
跨平台 |
|
是否安装软件 |
否 |
否 |
需安装WKHtmlToPdf |
否 |
|
是否收费 |
免费 |
免费 |
免费 |
收费 |
|
转换Html |
效率 |
速度快 |
未测 |
速度慢。相比URL来说,效率较慢。能忽略一些html语法或资源是否存在问题。 |
速度快。部分CSS样式不支持。 |
效果 |
存在样式失真问题。 对html语法有一定要求 |
存在样式失真问题。对html语法有较高要求。 |
失真情况较小 大部分网页能按Chome浏览器显示的页面转 |
部分CSS样式有问题。 |
|
转换URL |
效率 |
未测 |
未测 |
效率不是特别高 |
未测 |
效果 |
未测 |
未测 |
部分网页由于其限制,或将出现html网页不完整。 |
未测 |
|
优点 |
不需安装软件、转换速度快 |
不需安装软件、转换速度快 |
生成PDF质量高 |
不需要安装软件、转换速度快 |
|
缺点 |
对html标签严格,少一个结束标签就会报错; 服务器需要安装字体 |
对html标签严格,少一个结束标签就会报错; 服务器需要安装字体
|
需要安装软件、时间效率不高 |
对部分CSS样式不支持。 |
|
评价 |
|
|
|
|
综合:使用WKHtmlToPdf效果(样式)最好。但速度较慢(对于文件来说)。其余均有大大小小的失真问题。
|
分页 |
图片 |
表格 |
链接 |
中文 |
特殊字符 |
整体样式 |
速度 |
IText |
支持 |
支持 |
支持 |
支持 |
支持 |
支持 |
失真问题 |
快 |