POI 读取excel图片并定位图片需要提前注意的事项

场景介绍

因为一直在使用阿里的EasyExcel也挺方便的,而且性能也是非常不错,但是有些场景还是不支持,比如说读取excel中的指定行指定列的图片信息。

毕竟Apache的POI还是比较强大,对于一些图片的处理不管是word和PDF还有他们之间的相互转换都有相应的API支持。

tips:小技巧

我这里主要是想分享一下在处理excel图片的过程中所遇到的一些小问题。

  1. excel中的图片和文字等并不是统一处理的,而是分开的。
  2. 普通的文字内容能通过行列号直接能准确的定位到,图片则“不能”,为啥会主动加上引号,因为图片的位置跟他在的单元格有绝对的关系,是有边界的。下文会验证这点。
  3. 假如现在的需求是处理每一行的excel内容,并要求把图片也入库,则需要分开处理图片和别的列的内容。

实验环境

POI指定版本如下:

 <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-ooxml</artifactId>
            <version>3.17</version>
 </dependency>

JDK版本:1.8

所用的excel文件如下图:

现在接下来就是通过POI读取到两张图片资源,并打印相应的行号和列号。

public static void main(String[] args) {

        // 文件路径可以根据自己需求来 我的是放在本地根路径下了
        File file = new File("static/image/导入图片.xlsx");
        XSSFWorkbook wb = null;
        try {
            wb = new XSSFWorkbook(file);
        } catch (IOException | InvalidFormatException e) {
            e.printStackTrace();
        }
        XSSFSheet sheet = wb.getSheetAt(0);
        List<POIXMLDocumentPart> list = sheet.getRelations();
        for (POIXMLDocumentPart part : list) {
            if (part instanceof XSSFDrawing) {
                XSSFDrawing drawing = (XSSFDrawing) part;
                List<XSSFShape> shapes = drawing.getShapes();
                for (XSSFShape shape : shapes) {
                    XSSFPicture picture = (XSSFPicture) shape;
                    PictureData pic = picture.getPictureData();
                    XSSFClientAnchor anchor = picture.getPreferredSize();
                    CTMarker marker = anchor.getFrom();
                    // 获取图片格式
                    String ext = pic.suggestFileExtension();
                    log.info("行号[{}],单元格[{}],图片格式[{}]", marker.getRow(), marker.getCol(), ext);
                }
            }
        }

    }

以上代码也很简单,直接就能跑起来,如果按照上面excel的图片文件位置,读取出来的图片坐标也符合预期,结果如下:

但是如果把图片放置的单元格稍微拖动一下,改成这样的:不仔细看或者运营人员稍微处理不当,两个单元格出现相互覆盖的情况,读取入库可能就出现错位了。

实验结果也正是如此:

类似的如果是图片横向的覆盖左边的单元格,图片的坐标也是就近原则。效果如下:

实验结果如下:

总结:

最后我总结下:如果需求中有了类似的场景需要用到excel处理图片,并且还需要入库,数据库最好是存储图片资源的路径,次之可以把图片转成Base64也可行。

我比较推荐第一种,可以单独开一个线程来异步处理类似这样的导入导出任务,慢一点也无所谓,或者定时任务也行。

在保证图片没有错位的前提下,读取到图片后,提前先把图片上传到指定的服务器(有CDN更好)返回图片所在的行号和列号和图片资源URL,然后在读取每一行excel根据行号判断该行对应的图片资源是哪一列,把资源路径设置好,这里可以稍微处理下,如果该图片是在前端后期直接在页面上渲染,可对该资源URL加上<img></img>标签。比如:

String.format("<img src='%s%s' alt='' width='324' height='273'>", urlPrefix, resource.getPath())

 

  • 6
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值