Java 使用aspose-words实现word转pdf、html、图片

Java word转html、图片

1.下载aspose-words-20.12-jdk17-crack.jar

资源链接 https://download.csdn.net/download/qq_43601009/88466502
此jar包不包含在maven中心仓库中,所以下载手动下载并本地引入

2.将jar包放到项目中

建立src的同级目录lib,将下载好的jar包放到lib下

这里很多博客都写了在resources下创建lib,本人试过后会一直报错,放在src同级的lib可以正常运行。

3.将本地jar包以maven的方式引入

3.1

<!--引入本地jar包-->
        <dependency>
            <groupId>com.aspose</groupId>
            <artifactId>aspose-words</artifactId>
            <scope>system</scope>
            <version>15.8.0</version>
            <systemPath>${basedir}/lib/aspose-words-20.12-jdk17-crack.jar</systemPath>
        </dependency>

3.2

<build>
	<plugin>
          <groupId>org.springframework.boot</groupId>
          <artifactId>spring-boot-maven-plugin</artifactId>
          <configuration>
          <!-- maven打包时会将外部引入的jar包(比如在根目录下或resource文件下新加外部jar包)打包到项目jar -->
          <includeSystemScope>true</includeSystemScope>
          </configuration>
      </plugin>
</build>

4.AsposeUtils

此工具可以word转图片、html,但是在转html时,可能会因为图片导致排版较乱的问题。

import com.aspose.words.Document;
import com.aspose.words.HtmlSaveOptions;
import com.aspose.words.ImageSaveOptions;
import com.aspose.words.SaveFormat;

import javax.imageio.stream.ImageInputStream;
import java.awt.*;
import java.awt.image.BufferedImage;
import java.io.*;
import java.util.ArrayList;
import java.util.Date;
import java.util.List;


public class AsposeUtils {

    //outputStream转inputStream
    public static ByteArrayInputStream parse(OutputStream out) throws Exception {
        ByteArrayOutputStream baos = new ByteArrayOutputStream();
        baos = (ByteArrayOutputStream) out;
        ByteArrayInputStream swapStream = new ByteArrayInputStream(baos.toByteArray());
        return swapStream;
    }

    /**
     * word和txt文件 转换 图片
     *
     * @param inputStream
     * @param
     * @return
     * @throws Exception
     */
    public static List<BufferedImage> wordToImg(InputStream inputStream) throws Exception {
        try {
            Date start = new Date();
            Document doc = new Document(inputStream);
            ImageSaveOptions options = new ImageSaveOptions(SaveFormat.PNG);
            options.setPrettyFormat(true);
            options.setUseAntiAliasing(true);
            options.setUseHighQualityRendering(true);
            int pageCount = doc.getPageCount();
            //生成前pageCount张,这可以限制输出长图时的页数(方法入参可以传值pageNum)
           /*if (pageCount > pageNum) {
               pageCount = pageNum;
           }*/
            List<BufferedImage> imageList = new ArrayList<BufferedImage>();
            for (int i = 0; i < pageCount; i++) {
                OutputStream output = new ByteArrayOutputStream();
                options.setPageIndex(i);
                doc.save(output, options);
                ImageInputStream imageInputStream = javax.imageio.ImageIO.createImageInputStream(parse(output));
                imageList.add(javax.imageio.ImageIO.read(imageInputStream));
            }
            List<BufferedImage> imageList2 = new ArrayList<BufferedImage>();
            //这个重新生成新的图片是因为直接输出的图片底色为红色
            for (int j = 0; j < imageList.size(); j++) {
                // 生成新图片
                BufferedImage destImage = imageList.get(j);
                int w1 = destImage.getWidth();
                int h1 = destImage.getHeight();
                destImage = new BufferedImage(w1, h1, BufferedImage.TYPE_INT_RGB);
                Graphics2D g2 = (Graphics2D) destImage.getGraphics();
                g2.setBackground(Color.LIGHT_GRAY);
                g2.clearRect(0, 0, w1, h1);
                g2.setPaint(Color.RED);
                // 从图片中读取RGB
                int[] ImageArrayOne = new int[w1 * h1];
                ImageArrayOne = imageList.get(j).getRGB(0, 0, w1, h1, ImageArrayOne, 0, w1); // 逐行扫描图像中各个像素的RGB到数组中
                destImage.setRGB(0, 0, w1, h1, ImageArrayOne, 0, w1); // 设置上半部分或左半部分的RGB
                imageList2.add(destImage);
            }
            Date end = new Date();
            long l = end.getTime() - start.getTime();
            long hour = l / (1000 * 60 * 60);
            long min = (l - hour * (1000 * 60 * 60)) / (1000 * 60);
            long s = (l - hour * (1000 * 60 * 60) - min * 1000 * 60) / (1000);
            long ss = (l - hour * (1000 * 60 * 60) - min * 1000 * 60 - s * 1000) / (1000 / 60);
            System.out.println("word转图片时间:" + min + "分" + s + "秒" + ss + "毫秒");//hour+"小时"+
            return imageList2;
        } catch (Exception e) {
            e.printStackTrace();
            throw e;
        }
    }

    /**
     * 合并任数量的图片成一张图片
     *
     * @param isHorizontal true代表水平合并,fasle代表垂直合并
     * @param imgs         待合并的图片数组
     * @return
     * @throws IOException
     */
    public static BufferedImage mergeImage(boolean isHorizontal, List<BufferedImage> imgs) throws IOException {
        // 生成新图片
        BufferedImage destImage = null;
        // 计算新图片的长和高
        int allw = 0, allh = 0, allwMax = 0, allhMax = 0;
        // 获取总长、总宽、最长、最宽
        for (int i = 0; i < imgs.size(); i++) {
            BufferedImage img = imgs.get(i);
            allw += img.getWidth();
            if (imgs.size() != i + 1) {
                allh += img.getHeight() + 5;
            } else {
                allh += img.getHeight();
            }
            if (img.getWidth() > allwMax) {
                allwMax = img.getWidth();
            }
            if (img.getHeight() > allhMax) {
                allhMax = img.getHeight();
            }
        }
        // 创建新图片
        if (isHorizontal) {
            destImage = new BufferedImage(allw, allhMax, BufferedImage.TYPE_INT_RGB);
        } else {
            destImage = new BufferedImage(allwMax, allh, BufferedImage.TYPE_INT_RGB);
        }
        Graphics2D g2 = (Graphics2D) destImage.getGraphics();
        g2.setBackground(Color.LIGHT_GRAY);
        g2.clearRect(0, 0, allw, allh);
        g2.setPaint(Color.RED);

        // 合并所有子图片到新图片
        int wx = 0, wy = 0;
        for (int i = 0; i < imgs.size(); i++) {
            BufferedImage img = imgs.get(i);
            int w1 = img.getWidth();
            int h1 = img.getHeight();
            // 从图片中读取RGB
            int[] ImageArrayOne = new int[w1 * h1];
            ImageArrayOne = img.getRGB(0, 0, w1, h1, ImageArrayOne, 0, w1); // 逐行扫描图像中各个像素的RGB到数组中
            if (isHorizontal) { // 水平方向合并
                destImage.setRGB(wx, 0, w1, h1, ImageArrayOne, 0, w1); // 设置上半部分或左半部分的RGB
            } else { // 垂直方向合并
                destImage.setRGB(0, wy, w1, h1, ImageArrayOne, 0, w1); // 设置上半部分或左半部分的RGB
            }
            wx += w1;
            wy += h1 + 5;
        }
        return destImage;
    }

    /**
     * 当文档中含有中文字符时,该段代码的执行需要调用操作系统的本地字体库支持,否则所有中文字符都将乱码。
     * <p>
     * 该段代码如果想要在Linux服务器上完美运行,需要给Linux服务器安装中文字体库
     * <p>
     * 如何在Linux环境安装Windows字体库
     * Java使用Spire.Pdf或Aspose-Words实现Word转换Pdf在Linux服务器上的中文乱码问题
     * 解决: https://blog.csdn.net/neulily2005/article/details/106003527
     */
    public static boolean wordToPdf(String inPath, String outPath) {
        FileOutputStream os = null;
        try {
            long old = System.currentTimeMillis();
            File file = new File(outPath); // 新建一个空白pdf文档
            os = new FileOutputStream(file);
            Document doc = new Document(inPath); // Address是将要被转化的word文档
            //排版问题解决(word文档在编辑的时候是采用的多页编辑。页面效果是单页,可是在apose将word文档转为pdf后就变成了两页)
            Document document = new Document();//新建一个空白pdf文档
            document.removeAllChildren();
            document.appendDocument(doc, ImportFormatMode.USE_DESTINATION_STYLES);//保留样式
            //表格样式处理
            TableCollection tables = document.getFirstSection().getBody().getTables();
            for (Table table : tables) {
                RowCollection rows = table.getRows();
                table.setAllowAutoFit(false);
                for (Row row : rows) {
                    CellCollection cells = row.getCells();
                    for (Cell cell : cells) {
                        CellFormat cellFormat = cell.getCellFormat();
                        cellFormat.setFitText(false);
                        cellFormat.setWrapText(true);
                    }
                }
            }
            document.save(os, SaveFormat.PDF);// 全面支持DOC, DOCX, OOXML, RTF HTML, OpenDocument, PDF,
            // EPUB, XPS, SWF 相互转换
            long now = System.currentTimeMillis();
            System.out.println("pdf转换成功,共耗时:" + ((now - old) / 1000.0) + "秒"); // 转化用时
        } catch (Exception e) {
            e.printStackTrace();
            return false;
        } finally {
            if (os != null) {
                try {
                    os.flush();
                    os.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }
        return true;
    }

    public static boolean wordToHtml(InputStream is, String outPath) {
        FileOutputStream os = null;
        try {
            HtmlSaveOptions opts = new HtmlSaveOptions(SaveFormat.HTML);
            opts.setExportXhtmlTransitional(true);
            opts.setExportImagesAsBase64(true);
            opts.setExportPageSetup(true);
            long old = System.currentTimeMillis();
            File file = new File(outPath); // 新建一个空白pdf文档
            os = new FileOutputStream(file);
            Document doc = new Document(is); // Address是将要被转化的word文档
            doc.save(os, opts);// 全面支持DOC, DOCX, OOXML, RTF HTML, OpenDocument, PDF,
            // EPUB, XPS, SWF 相互转换
            long now = System.currentTimeMillis();
            System.out.println("pdf转换成功,共耗时:" + ((now - old) / 1000.0) + "秒"); // 转化用时
        } catch (Exception e) {
            e.printStackTrace();
            return false;
        } finally {
            if (os != null) {
                try {
                    os.flush();
                    os.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }
        return true;
    }
}
  • 8
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: aspose-words-19.3-jdk17.jar-java 是一个 Java 库,用于处理 Word 文档。它提供了一套丰富的功能和方法,允许开发人员在 Java 应用程序中读取、创建、编辑和Word 文档。 使用 aspose-words-19.3-jdk17.jar-java,可以轻松地将 Word 文档导入到 Java 应用程序中,并以编程方式访问和修改其中的内容。这个库支持各种 Word 文档格式,如 DOC、DOCX、RTF 等。可以使用它来提取文本、插入或删除段落、添加或删除图片、设置样式和格式等。 这个库还提供了强大的换功能,可以将 Word 文档换为其他格式,比如 PDFHTML、EPUB 等。同时,也可以将其他格式的文档换为 Word 文档。 aspose-words-19.3-jdk17.jar-java 在处理 Word 文档时提供了高度的可定制性。开发人员可以根据自己的需求设置字体、颜色、段落格式、页眉页脚等等。此外,它还支持在文档中插入书签、超链接、表格、图表等,以满足更复杂的需求。 总之,aspose-words-19.3-jdk17.jar-java 是一个功能强大、易于使用Java 库,适用于处理 Word 文档。它可为开发人员提供丰富的功能和方法,让他们能够方便地读取、创建、编辑和Word 文档。无论是对于个人使用还是开发团队,这个库都是一个非常有价值的工具。 ### 回答2: aspose-words-19.3-jdk17.jar是一个Java库,用于处理Word文档。它提供了丰富的功能和API,可以读取、修改和创建Word文档。通过它,我们可以在Java应用程序中实现Word文档的自动化处理。 使用aspose-words-19.3-jdk17.jar,我们可以轻松地读取现有的Word文档,并提取其中的文本、表格、图像等元素。同时,还可以编辑文档的样式、格式和布局。例如,我们可以插入、删除或合并段落,设置字体、字号、颜色等。 这个库还提供了对Word文档的导出和换功能。我们可以将文档保存为PDFHTML、XML或其他流行的格式。此外,我们还可以将Word文档换为其他Office应用程序的格式,如Excel或PowerPoint。 aspose-words-19.3-jdk17.jar还支持Word模板的创建和填充。我们可以使用预定义的模板,向其添加数据,并将其保存为新的Word文档。这对于生成报告、信函、合同等标准格式的文档非常有用。 总而言之,aspose-words-19.3-jdk17.jar是一个功能强大的Java库,提供了处理Word文档的丰富功能和API。它可以帮助我们在Java应用程序中实现Word文档的读取、编辑、导出和换。无论是处理现有文档还是生成新的文档,它都是一个非常有用的工具。 ### 回答3: Aspose.Words是一个强大的Java库,用于处理和操作Microsoft Word文档。版本19.3是指该库的19.3版本,该版本具有很多功能和改进。 Aspose.Words可以在Java应用程序中创建,读取,操作和Word文档。使用该库,您可以轻松地访问文档的内容,如文本,图片,表格,样式和格式。您可以添加,删除和修改文档的内容,包括段落,表格,图像等。您还可以应用不同的格式和样式,如字体,颜色,段落间距等。 此外,Aspose.Words还支持文档的换功能。您可以将Word文档换为其他格式,如PDFHTML,纯文本等。同样,您也可以将其他格式的文件换为Word文档。这使得Aspose.Words成为一种非常有用的工具,适用于处理和换各种类型的文档。 Aspose.Words 19.3版特别为JDK17设计,以确保与最新的Java开发环境兼容。这意味着您可以在使用JDK17的项目中无缝集成和使用Aspose.Words库,无需担心任何兼容性问题。 总而言之,Aspose.Words 19.3-jdk17.jar是一个功能强大的Java库,它为您提供了处理和操作Microsoft Word文档的能力。它支持多种功能,如创建,读取,修改和Word文档。此库与JDK17兼容,可以轻松地集成到Java项目中,并为您的文档处理需求提供强大的支持。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值