java pdf转html插件pdf2htmlex

pdf2htmlex是一个开源的插件,pdf转html效果很不错,只是清晰度稍微有一点降低,先展示一下转换效果:

pdf:

转换后的html

第一步:下载插件

http://soft.rubypdf.com/software/pdf2htmlex-windows-version

第二步:安装插件

解压安装包,cmd到pdf2htmlEX所在的目录,输入 .\pdf2htmlEX,回车后出现以下界面就是成功啦!

第三步:调用命令执行pdf2htmlex实现PDF转HTML

这步有两种方式:

方式一:使用编译器执行

cmd到pdf2htmlEX目录,输入pdf2htmlex --zoom 1.8 TP-PDF-1.pdf,TP-PDF-1.pdf是pdf的名称,我把这个pdf文件放在pdf2htmlEX目录下面。执行后在此目录下生成html文件,如下图所示:

 方法二:编写java处理类


/**
 * pdf文件转html工具类
 */
public class Pdf2htmlEXUtil {
	private static final int OS = 1;
	/**
	 * 调用pdf2htmlEX将pdf文件转换为html文件
	 * @param exeFilePath pdf2htmlEX.exe文件路径
	 * @param pdfFile pdf文件绝对路径
	 * @param [destDir] 生成的html文件存放路径
	 * @param htmlName 生成的html文件名称
	 * @return
	 */
	public static boolean pdf2html(String exeFilePath,String pdfFile,String destDir,String htmlFileName){
		if(OS==2){//linux
			return pdf2html_linux(htmlFileName, htmlFileName, htmlFileName);
		}
		if(!(exeFilePath!=null&&!"".equals(exeFilePath)
				&&pdfFile!=null&&!"".equals(pdfFile)
				&&htmlFileName!=null&&!"".
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
PDF-XChange介绍 ================ 是来自加拿大的全功能PDF套件,包括一个PDF阅读器PDF-XChange Viewer、PDF处理工具PDF-XChange Tools 4.0和Office文档换工具PDF-XChange Office2PDF,使用体验超过Foxit Phantom。不仅支持PDF的阅读,还可进行编辑、换、提取、OCR等操作。注册后可去除水印,并解锁众多编辑功能。 PDF-XChange[1]是一款功能强大的PDF换工具,可以将各种类型的文件可以化为PDF格式,并且还支持Word、Excel、图片以及多种视频格式。它具有丰富的配置和功能选项,而且非常的简单易用。它还能够当作打印机使用,以代替传统的纸质输出。 PDF-XChange通过捕获与重定位的方式创建一个完全兼容,并可实现文本搜索功能的Adobe PDF文件(使其符合原文件的可读性-图片文件不可进行文本搜索)。同时还可获得MS Office集成的额外功能,如:点击目录(TOC)和支持嵌入式URL(如:“点击这里”类型的链接) + 将Office文件换为PDF。以批处理的方式将MS Office所支持格式(如:.doc, .xls, .rtf, .html, .txt等)的多个文件换为PDFPDF-XChange功能特征: ==================== 世界上最好的压缩与优化技术 支持PDF/A格式以保证对长期存档标准的支持 提供给MS Office集成的扩展功能—通过工具栏实现 分栏打印模式-将多页自动装载并重新调整为一页,且可正确计算各页位置 增强的视觉布局预检器,将允许你通过使用打印选项调整页面大小 灵活的DPI输出选项,可设置范围:50-2400 支持中日韩字体/字符 添加水印或覆盖PDF文档,从而生成新的PDF并输出。 – 是企业文具使用的理想选择 自动生成书签 自动生成页眉/页脚 扩展字体嵌入选项 规范化-创建特定打印机的参数并保存供以后使用 MAPI/SMTP邮件集成选项 支持Windows 2000到Vista 64(32/64位)系统 关于Windows 95, 98, ME, NT请参阅以下选项 软件集合/终端服务器认证 基于宏的文件自动命名/定位—可以使用Javascript 完整的数字签名和安全设置功能,包括40/128位的和AES加密选项 增强的MS Office-免费的批处理换器 ===================== 安装完毕,默认语言是英语。在界面内点击Edit-Preferences-Languages,选择Set to Users Default Regional Settings(Chinese(PRC))、或者Choose Custom Language--Chinese(PRC),换为简体中文。 它具有丰富的配置和功能选项,而且非常的简单易用。它还能够当作打印机使用,以代替传统的纸质输出。如果你不这样认为,你可以下载多个PDF制作软件试试看,进行比较之后,你就知道了,这就是所谓不怕不识货就怕货比货。 ==================== 注意:本安装程序集成注册码,禁止更改,否则不能使用或使用会有水印!!!
《CSS网站布局实录:基于Web标准的网站设计指南(第2版)》内容提要: 本书是一本讲述基于Web标准的应用CSS进行网站布局设计与重构的典范之作。 本书以实例为主,一步步地告诉大家如何进行符合Web 2.0标准的CSS布局设计。具备了知识全面、完美应用(CSS选择器、样式继承、层叠、格式化、XML标签、CSS滤镜等。文本、图像、超链接、列表、菜单、网站导航、表单、数据表格、浮动布局等CSS布局控制。),智能、创造型布局思维(智慧、完美视觉艺术效果之CSS布局技巧、CSS Hack实践战略),Web技术团队倾情奉献(来自CSS布局与Web标准应用之先驱——闪客帝国... [显示全部] 《CSS网站布局实录:基于Web标准的网站设计指南(第2版)》图书目录: 第1章 Web标准与CSS布局概述 1.1 Web标准的历史及发展 1.1.1 什么是Web标准 1.1.2 Web表现层技术 1.1.3 Web标准的历史 1.2 Web标准的构成 1.2.1 结构(Structure) 1.2.2 表现(Presentation) 1.2.3 行为(Behavior) 1.3 Web标准有什么好处 1.4 CSS布局与table布局的区别 1.4.1 CSS 2.0的优势 1.4.2 传统的table布局与CSS布局 1.5 向Web标准过渡 1.5.1 从HTML向XHTML 1.5.2 发挥CSS 2.0的作用 1.6 常见问题 1.6.1 什么样的网站才符合Web标准 1.6.2 使用Web标准之后表格还有用吗 1.6.3 可以继续使用HTML来设计网页吗 1.6.4 为什么不直接使用到XML 1.6.5 学习CSS布局比表格困难吗 1.6.6 CSS布局是否意味着必须手写代码 1.6.7 什么叫网站重构 1.6.8 使用Web标准之后就不再存在兼容性问题了吗 1.6.9 有没有Web标准方面的优秀图书或网站 1.6.10 使用CSS设计只能做出简单的网页吗 1.7 面向现在与未来的设计 1.7.1 Web标准与Web 2.0 1.7.2 用户体验技术 1.7.3 用户体验设计的发展趋势 第2章 XHTML与CSS基础 2.1 XHTML基础 2.2 选择合适的DTD 2.3 选择合适的标签 2.4 给CSS留下接口 2.5 良好的XHTML编写习惯 2.6 CSS语法结构 2.6.1 CSS属性与选择符 2.6.2 类型选择符 2.6.3 群组选择符 2.6.4 包含选择符 2.6.5 id及class选择符 2.6.6 标签指定式选择符 2.6.7 组合选择符 2.6.8 伪类及伪对象 2.6.9 通配选择符 2.7 CSS数据单位 2.8 应用CSS到网页中 2.8.1 行间样式表 2.8.2 内部样式表 2.8.3 外部样式表 2.9 样式优先权问题 2.9.1 写法优先权 2.9.2 选择符优先权 2.9.3 样式继承 2.9.4 !important语法 2.10 代码注释 2.11 CSS开发环境与调试环境 第3章 CSS网页布局与定位 3.1 认识div 3.1.1 div是什么 3.1.2 如何使用div 3.1.3 理解div 3.1.4 并列与嵌套div结构 3.1.5 使用合适对象来布局 3.2 一列固定宽度 3.3 一列宽度自适应 3.4 二列固定宽度 3.5 二列宽度自适应 3.6 两列右列宽度自适应 3.7 二列固定宽度居中 3.8 三列浮动中间列宽度自适应 3.9 高度自适应 3.10 盒模型详解(.Box Model) 3.10.1 什么是盒模型 3.10.2 盒模型的细节 3.10.3 上下margin叠加问题 3.10.4 左右margin加倍问题 3.11 深入浮动(Float) 3.11.1 文档流(Document Flow) 3.11.2 浮动定位 3.11.3 浮动的清理(Clear) 3.11.4 何时选用浮动定位 3.12 绝对定位与相对定位 3.12.1 绝对定位 3.12.2 相对定位 3.12.3 何时选用绝对与相对定位 第4章 CSS网站元素设计 4.1 用CSS设计网站导航 4.1.1 横向导航 4.1.2 纵向导航 4.1.3 下拉及多级弹出式菜单 4.1.4 门户网站的导航设计(闪客帝国) 4.2 背景控制 4.2.1 背景颜色 4.2.2 背景图片 4.2.3 背景定位 4.2.4 背景滚动 4.2.5 背景属性缩写 4.2.6 基于背景控制的导航优化 4.3 使用列表元素 4.3.1 ul无序列表 4.3.2 ol有序列表 4.3.3 改变项目符号样式 4.3.4 使用图片自定义项目符号 4.3.5 使列表变为段落 4.3.6 列表缩进排版 4.3.7 复杂列
Free Spire.PDF for .NET 是 Spire.PDF for .NET 的免费版本,无需购买即可用于个人或商业用途。使用该组件,程序员可以 在.NET 程序中创建、读取、写入、编辑和操作 PDF 文档。这个控件能支持的功能十分全面,例如文档安全性设置(电子签名),提取 PDF 文本、附件、图片,PDF 合并和拆分,更新 Metadata,设置 Section,绘制图形、插入图片、表格制作和加工、导入数据等等。除此以外,Spire.PDF 还可以将 TXT 文本、图片、HTML 高质量地换为 PDF 文件格式。 主要功能如下: 1.高质量的文档换。Free Spire.PDF for .NET 支持 PDF 到 Word、XPS、SVG、EMF、Text 和图片(EMF、JPG、PNG、BMP、TIFF)的格式换。也支持从 XML、HTML、RTF、XPS、Text、图片等格式生成 PDF 文档。 2.文档操作及域功能。支持合并、拆分 PDF 文档,在原有的 PDF 文档页添加覆盖页。同时,Spire.PDF 提供导入、邮戳、小册子功能,以及帮助用户从数据库读取数据并填充到域的域填写功能。 3. 安全性设置。用户可以通过设置密码和数字签名来保护 PDF 文档。用户密码和所有者密码可以确定加密的 PDF 文档的可读性、可修改性、是否可打印等有选择性的限制。与此同时,数字签名作为一个更有效的方法,可以应用于维护和对PDF文档进行身份验证。 4.数据提取。支持快速高效地从 PDF 文档提取图片、文本、PDF 分页,以及附件。 5.文件属性设置。支持对 Metadata、文件属性、页面方向、页面大小进行设置。其中文件属性包括文件限制(打印、页面提取、加评论等方面的权限限制)以及文件描述属性(文件名称、作者、主题、关键字等)。使用 Spire.PDF for .NET,用户还可以根据自己阅读喜好设定默认打开页码,分页模式,缩放比例和打印缩放,等等。 6.其他功能。 支持多种语言,支持字体格式、对齐方式设置。 绘制文字,图片,图形。 支持添加图层,透明图像,Color Space,条形码到 PDF。 支持 PDF/A-1b、PDF/x1a:2001 格式。 添加梯状图形和矢量图像到指定位置。 添加并格式化表格。 插入交互元素,例如添加自定义的 Annotation、Action、JavaScript、附件、书签等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值