Java PDF2HTML 工具类

之前写项目遇到一个需求,pdf转html,然后上网搜了一个util记录一下

package com.shawn.Utils;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.rendering.PDFRenderer;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.FileOutputStream;

public class Pdf2htmlInJavaUtils {
    public static void PdfToImage(String pdfurl){
        StringBuffer buffer = new StringBuffer();
        FileOutputStream fos;
        PDDocument document;
        File pdfFile;
        int size;
        BufferedImage image;
        FileOutputStream out;
        Long randStr = 0l;
        //PDF转换成HTML保存的文件夹
        String path = "/Users/***/Desktop/";
        File htmlsDir = new File(path);
        if(!htmlsDir.exists()){
            htmlsDir.mkdirs();
        }
        File htmlDir = new File(path+"/");
        if(!htmlDir.exists()){
            htmlDir.mkdirs();
        }
        try{
            //遍历处理pdf附件
            randStr = System.currentTimeMillis();
            buffer.append("<!doctype html>\r\n");
            buffer.append("<head>\r\n");
            buffer.append("<meta charset=\"UTF-8\">\r\n");
            buffer.append("</head>\r\n");
            buffer.append("<body style=\"background-color:gray;\">\r\n");
            buffer.append("<style>\r\n");
            buffer.append("img {background-color:#fff; text-align:center; width:100%; max-width:100%;margin-top:6px;}\r\n");
            buffer.append("</style>\r\n");
            document = new PDDocument();
            //pdf附件
            pdfFile = new File(pdfurl);
            document = PDDocument.load(pdfFile, (String) null);
            size = document.getNumberOfPages();
            Long start = System.currentTimeMillis(), end = null;
            System.out.println("===>pdf : " + pdfFile.getName() +" , size : " + size);
            PDFRenderer reader = new PDFRenderer(document);
            for(int i=0 ; i < size; i++){
                //image = newPDFRenderer(document).renderImageWithDPI(i,130,ImageType.RGB);
                image = reader.renderImage(i, 1.5f);
                //生成图片,保存位置
                out = new FileOutputStream(path + "/"+ "image" + "_" + i + ".jpg");
                ImageIO.write(image, "png", out); //使用png的清晰度
                //将图片路径追加到网页文件里
                buffer.append("<img src=\"" + path +"/"+ "image" + "_" + i + ".jpg\"/>\r\n");
                image = null; out.flush(); out.close();
            }
            reader = null;
            document.close();
            buffer.append("</body>\r\n");
            buffer.append("</html>");
            end = System.currentTimeMillis() - start;
            System.out.println("===> Reading pdf times: " + (end/1000));
            start = end = null;
            //生成网页文件
            fos = new FileOutputStream(path+randStr+".html");
            System.out.println(path+randStr+".html");
            fos.write(buffer.toString().getBytes());
            fos.flush(); fos.close();
            buffer.setLength(0);



        }catch(Exception e){
            System.out.println("===>Reader parse pdf to jpg error : " + e.getMessage());
            e.printStackTrace();
        }
    }
    public static void main(String[] args) {
        //传入PDF地址
        PdfToImage("/Users/***/Desktop/***.pdf"); 
    }
}

这里还需要三个jar包,这是链接:https://pan.baidu.com/s/1pAP8qwyp9KmSRJ0mknRoiw

转载请注明出处(。◕ˇ∀ˇ◕)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Java PDF工具类是一个Java语言开发的库,用于在Java应用程序中处理PDF文件。这个库提供了丰富的API,可以实现创建、读取、修改和转换PDF文件。它是一个非常强大的工具,广泛用于企业级应用程序和互联网应用程序。 Java PDF工具类的主要功能包括: 1.创建PDF文件 Java PDF工具类提供了一个创建PDF文件的API,可以通过代码生成PDF文件。这个API非常强大,可以实现任何类型的PDF文件,包括高级的PDF文件,比如包含表单和多媒体元素的PDF文件。 2.读取PDF文件 Java PDF工具类提供了API,可以读取已有的PDF文件。这个API可以获取PDF文件中的所有数据,并将其转换为Java对象。这个API非常有用,可以用于将PDF文件转换为HTML文件或其他格式的文件。 3.修改PDF文件 Java PDF工具类提供了API,可以修改已有的PDF文件。这个API非常灵活,可以修改PDF文件的任何部分,包括文本、图像、文本框、表格、页面格式等等。 4.转换PDF文件 Java PDF工具类还提供了转换PDF文件的API,可以将PDF文件转换为其他格式的文件,比如HTML、XML、DOC、TXT、图像等等。这个API非常有用,可以将PDF文件作为数据源,输出到其他应用程序中。 Java PDF工具类是一个非常成功的工具,非常适合企业级应用程序和互联网应用程序。它不仅可以处理PDF文件,还可以处理其他类型的文件,比如图像、音频、视频等等。无论你需要创建、读取、修改或转换PDF文件,Java PDF工具类都可以满足你的需要。它是一个高质量、高性能、易于使用的工具,值得尝试。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值