PPT转图片(Java)

首先ppt本身就可以转成png、jepg等图片文件

 从中挑取一张来和之后的做对比

 这个就是转pdf效果最好的方法

apache的poi来实现(图片文字失真、当ppt里面带表格时无法解析)

依赖:选在4.1.2是因为是Maven Repository中使用人数最多且我用起来感觉是效果最好的

        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi</artifactId>
            <version>4.1.2</version>
        </dependency>
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-ooxml</artifactId>
            <version>4.1.2</version>
        </dependency>
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-scratchpad</artifactId>
            <version>4.1.2</version>
        </dependency>

简单实现的demo

import org.apache.poi.hslf.usermodel.*;
import org.apache.poi.util.IOUtils;
import org.apache.poi.xslf.usermodel.*;

import java.awt.*;
import java.awt.geom.Rectangle2D;
import java.awt.image.BufferedImage;
import java.io.*;
import java.util.ArrayList;
import java.util.List;

public class PPT2ImgTest {
    public static void main(String[] args) throws FileNotFoundException {
        PPT2ImgTest.PPTtoImage("C:\\Users\\dell\\Desktop\\zppt11092.pptx", "zppt11092.pptx");
    }

    public static List<String> PPTtoImage(String file, String fileName) throws FileNotFoundException {
        FileInputStream fileInputStream = new FileInputStream(file);
        try {
            if (fileName.endsWith(".pptx") || fileName.endsWith(".PPTX")) {
                return pptx2Image(fileInputStream,fileName);
            } else {
                return ppt2Image(fileInputStream,fileName);
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
        return null;
    }

    /**
     * 将pptx转成图片
     */
    public static List<String> pptx2Image(FileInputStream fileInputStream, String fileName) throws Exception {
        // 获取系统可用字体
//        FileInputStream is = new FileInputStream(filePath + fileName);
        XMLSlideShow ppt = new XMLSlideShow(fileInputStream);
        Dimension pgSize = ppt.getPageSize();
        int pageSize = ppt.getSlides().size();
        System.out.println("ppt 总页数:{}, 尺寸: width={},height={}"+ pageSize + pgSize.width + pgSize.height);
        List<String> imgFiles = new ArrayList<>();
        for (int i = 0; i < pageSize; i++) {
            //防止中文乱码
            handlerPPTXEncoding(ppt, i);
            BufferedImage img = new BufferedImage(pgSize.width, pgSize.height, BufferedImage.TYPE_INT_RGB);
            Graphics2D graphics = img.createGraphics();
            // clear the drawing area
            graphics.setPaint(Color.white);
            graphics.fill(new Rectangle2D.Float(0, 0, pgSize.width, pgSize.height));
            // render
            ppt.getSlides().get(i).draw(graphics);
            // save the output
            String pptName = fileName.substring(0, fileName.lastIndexOf("."));
//            String newImgPath = "/home/digitalData/imgPPT/"+pptName+"/";
            String newImgPath = "C:\\Users\\dell\\Desktop\\pptImage\\";
            File imgPath = new File(newImgPath);
            if (imgPath.exists()) {//图片目录存在则删除
                imgPath.delete();
            }
            imgPath.mkdirs();
            String file = newImgPath+pptName+ (i + 1) + ".png";
            imgFiles.add(file);
            FileOutputStream out = new FileOutputStream(file);
            javax.imageio.ImageIO.write(img, "png", out);
            IOUtils.closeQuietly(out);
        }
        IOUtils.closeQuietly(fileInputStream);
        return imgFiles;
    }

    /**
     * 将ppt转成图片,保存在同一目录的image目录下
     *
     * @param fileName ppt 文件名
     */
    public static List<String> ppt2Image(FileInputStream fileInputStream, String fileName) throws IOException {
        // 获取系统可用字体
        HSLFSlideShow ppt = new HSLFSlideShow(fileInputStream);
        Dimension pgSize = ppt.getPageSize();
        List<String> imgFiles = new ArrayList<>();
        for (int i = 0; i < ppt.getSlides().size(); i++) {
            // 防止中文乱码
            handlerPPTEncoding(ppt, i);
            BufferedImage img = new BufferedImage(pgSize.width, pgSize.height, BufferedImage.TYPE_INT_RGB);
            Graphics2D graphics = img.createGraphics();
            // clear the drawing area
            graphics.setPaint(Color.white);
            graphics.fill(new Rectangle2D.Float(0, 0, pgSize.width, pgSize.height));
            // render
            ppt.getSlides().get(i).draw(graphics);
            // save the output
            String pptName = fileName.substring(0, fileName.lastIndexOf("."));
            String newImgPath = "/home/digitalData/imgP/"+pptName+"/";
            File imgPath = new File(newImgPath);
            if (imgPath.exists()) {//图片目录存在则删除
                imgPath.delete();
            }
            imgPath.mkdirs();
            String file = newImgPath + (i + 1) + ".png";
            imgFiles.add(file);
            FileOutputStream out = new FileOutputStream(file);
            javax.imageio.ImageIO.write(img, "png", out);
            IOUtils.closeQuietly(out);
            // resizeImage(filename, filename, width, height);
        }
        return imgFiles;
    }


    private static void handlerPPTEncoding(HSLFSlideShow ppt, int index) {
        for (HSLFShape shape : ppt.getSlides().get(index).getShapes()) {
            if (shape instanceof HSLFTextShape) {
                HSLFTextShape tsh = (HSLFTextShape) shape;
                for (HSLFTextParagraph p : tsh) {
                    for (HSLFTextRun r : p) {
                        String fontFamily = "宋体";
                        r.setFontFamily(fontFamily);
                    }
                }
            }
        }
    }

    private static void handlerPPTXEncoding(XMLSlideShow ppt, int index) {
        for (XSLFShape shape : ppt.getSlides().get(index).getShapes()) {
            if (shape instanceof XSLFTextShape) {
                XSLFTextShape tsh = (XSLFTextShape) shape;
                for (XSLFTextParagraph p : tsh) {
                    for (XSLFTextRun r : p) {
                        String fontFamily = r.getFontFamily();
                        fontFamily = "宋体";
                        r.setFontFamily(fontFamily);
                    }
                }
            }
        }
    }
}

效果:

 文字失真严重,还有一些图片识别效果不好,尽管可能有方式能优化一些,但是如果ppt里面有表格是无法解析的,所以不建议使用。

使用LibreOffice将PPT转成PDF,再由PDF转换成图片

下载LibreOffice(Centos7):

直接使用yum下载版本是5.3.6.1,可以使用

yum install libreoffice

从官网下载后再解压缩:Donate to LibreOffice | LibreOffice - Free Office Suite - Based on OpenOffice - Compatible with Microsoft

tar -xzvf LibreOffice_7.4.2_Linux_x86-64_rpm.tar.gz
cd LibreOffice_7.4.2_Linux_x86-64_rpm/RPMS/
sudo yum install *.rpm

这里不能直接使用wget获得压缩包的原因是下下来的压缩包是一个HTML document不能直接解压使用

使用的命令行:

libreoffice --headless --convert-to pdf:writer_pdf_Export ppt的地址.pptx --outdir 输出的文件夹地址

可以直接转jpg等图片但是只能转第一张ppt

解决中文字不一致问题

将C:\Windows\Fonts下文件的先拷贝一份出来,这样就是文件名为全英文的。

然后传到/usr/share/fonts下自创的文件夹

yum -y install ttmkfdir
ttmkfdir -e /usr/share/X11/fonts/encodings/encodings.dir    //搜索目录中所有的字体信息,汇总生成fonts.scale文件 具体有没有用不知道
vi /etc/fonts/fonts.conf,进入这个配置文件,
在Font directory list配置项下,添加<dir>/usr/share/fonts/自建的文件夹</dir>
退出后执行[fc-cache]刷新缓存

再配置完字体后,ppt中图片效果如下:

这里的文字格式稍微有些许不同,同时由于这个标题01是Agency FB字体(字体库里没有)识别的时候有格式变换,同时这个字体也不太一样了,但大致效果还算可以,可以将ppt中特殊字体下载下同步到字体库中来改善。

使用pdfbox转ppt为png:

依赖:

        <dependency>
            <groupId>org.apache.pdfbox</groupId>
            <artifactId>pdfbox</artifactId>
            <version>2.0.9</version>
        </dependency>

简单的demo实现:

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.rendering.PDFRenderer;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import java.io.OutputStream;
import java.nio.file.Files;

public class pdf2pngTest {

    public static void main(String[] args) {
        pdf2pngTest.pdf2png("C:\\Users\\dell\\Desktop\\zppt11092.pdf");
    }

    public static void pdf2png(String filePath) {
        File file = new File(filePath);
        try {
            PDDocument doc = PDDocument.load(file);
            PDFRenderer renderer = new PDFRenderer(doc);
            int pageCount = doc.getNumberOfPages();
            for (int i = 0; i < pageCount; i++) {
                BufferedImage image = renderer.renderImageWithDPI(i, 95);
                OutputStream out= Files.newOutputStream(new File("C:\\Users\\dell\\Desktop\\pdf2png\\" + (i + 1) + ".png").toPath());
                ImageIO.write(image, "png", out);
                out.close();
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

}

效果:

在实际使用时速度会慢一些,可以使用多线程或者使用别的方法。

使用GraphicsMagick转pdf为png:

yum -y install wget
//wget ftp://ftp.graphicsmagick.org/pub/GraphicsMagick/GraphicsMagick-LATEST.tar.gz    //官方镜像已经不能连接了
wget ftp://ftp.icm.edu.pl/pub/unix/graphics/GraphicsMagick/
tar -xzvf GraphicsMagick-LATEST.tar.gz
cd GraphicsMagick-1.3.30
yum install gcc libpng libjpeg libpng-devel libjpeg-devel ghostscript libtiff libtiff-devel freetype freetype-devel jasper jasper-devel bzip2-devel freetype-devel
./configure
make install
gm version

命令行使用:

gm convert +adjoin 存放pdf的位置.pdf 新建一个文件夹/图片名称%03d.png //%03d是3位自动补齐的意思

效果:

使用GraphicsMagick的效果是比pdfbox要好一些的,但是由于要下载部署同时还得使用命令行操作,我个人认为没必要使用。

其中LibreOffice和GraphicsMagick借鉴文章:实现PPT在线预览,PPT转图片方案 - JillWen - 博客园

这里面也包含着java实现的代码参考。

最终我使用的方法是LibreOffice转成pdf再直接使用pdfbox转图片的方法。

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值