pdf2htmlex是一个开源的插件,pdf转html效果很不错,只是清晰度稍微有一点降低,先展示一下转换效果:
pdf:
转换后的html
第一步:下载插件
http://soft.rubypdf.com/software/pdf2htmlex-windows-version
第二步:安装插件
解压安装包,cmd到pdf2htmlEX所在的目录,输入 .\pdf2htmlEX,回车后出现以下界面就是成功啦!
第三步:调用命令执行pdf2htmlex实现PDF转HTML
这步有两种方式:
方式一:使用编译器执行
cmd到pdf2htmlEX目录,输入pdf2htmlex --zoom 1.8 TP-PDF-1.pdf,TP-PDF-1.pdf是pdf的名称,我把这个pdf文件放在pdf2htmlEX目录下面。执行后在此目录下生成html文件,如下图所示:
方法二:编写java处理类
/**
* pdf文件转html工具类
*/
public class Pdf2htmlEXUtil {
private static final int OS = 1;
/**
* 调用pdf2htmlEX将pdf文件转换为html文件
* @param exeFilePath pdf2htmlEX.exe文件路径
* @param pdfFile pdf文件绝对路径
* @param [destDir] 生成的html文件存放路径
* @param htmlName 生成的html文件名称
* @return
*/
public static boolean pdf2html(String exeFilePath,String pdfFile,String destDir,String htmlFileName){
if(OS==2){//linux
return pdf2html_linux(htmlFileName, htmlFileName, htmlFileName);
}
if(!(exeFilePath!=null&&!"".equals(exeFilePath)
&&pdfFile!=null&&!"".equals(pdfFile)
&&htmlFileName!=null&&!"".