poi 移除图片_poi 获取excel中图片

该博客介绍了如何使用Apache POI库在Java中读取Excel文件中的图片,包括遍历shape获取图片信息,通过pictureIndex获取图片数据,并讨论了pictureIndex与图片数据之间的关系。博主分享了个人理解,但指出缺乏官方文档支持,同时提到对于2007版Excel(XSSF)的处理存在不同。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

先贴代码,再解释与疑问(这段代码是我努力了半天的结果)

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.InputStream;

import java.util.List;

import org.apache.poi.hssf.usermodel.HSSFClientAnchor;

import org.apache.poi.hssf.usermodel.HSSFPicture;

import org.apache.poi.hssf.usermodel.HSSFPictureData;

import org.apache.poi.hssf.usermodel.HSSFShape;

import org.apache.poi.hssf.usermodel.HSSFSheet;

import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import org.apache.poi.openxml4j.exceptions.InvalidFormatException;

import org.apache.poi.ss.usermodel.PictureData;

import org.apache.poi.ss.usermodel.WorkbookFactory;

public class ReadPicturesFromExcel {

public static void main(String[] args) throws InvalidFormatException,

Exception {

InputStream inp = new FileInputStream(

"D:\\Users\\Fancy1_Fan\\桌面\\work\\test.xls");

HSSFWorkbook workbook = (HSSFWorkbook) WorkbookFactory.create(inp);

List pictures = workbook.getAllPictures();

HSSFSheet sheet = (HSSFSheet) workbook.getSheetAt(0);

int i = 0;

for (HSSFShape shape : sheet.getDrawingPatriarch().getChildren()) {

HSSFClientAnchor anchor = (HSSFClientAnchor) shape.getAnchor();

if (shape instanceof HSSFPicture) {

HSSFPicture pic = (HSSFPicture) shape;

int row = anchor.getRow1();

System.out.println(i + "--->" + anchor.getRow1() + ":"

+ anchor.getCol1());

int pictureIndex = pic.getPictureIndex()-1;

HSSFPictureData picData = pictures.get(pictureIndex);

System.out.println(i + "--->" + pictureIndex);

savePic(row, picData);

}

i++;

}

}

private static void savePic(int i, PictureData pic) throws Exception {

String ext = pic.suggestFileExtension();

byte[] data = pic.getData();

if (ext.equals("jpeg")) {

FileOutputStream out = new FileOutputStream(

"D:\\Users\\Fancy1_Fan\\桌面\\work\\pict" + i + ".jpg");

out.write(data);

out.close();

}

if (ext.equals("png")) {

FileOutputStream out = new FileOutputStream(

"D:\\Users\\Fancy1_Fan\\桌面\\work\\pict" + i + ".png");

out.write(data);

out.close();

}

}

}

思路:

1.获得所有图片---->

2.得到sheet DrawingPatriarch的所有shape--->

3.获得shape的anchor --->

4.获得picture的pictureIndex(这个很关键)------->

5.最后假定pictureIndex就是allPictures中图片的位置,从而获得这张picture的data信息.

问题:

对于最后的假定没有官方文档的支持,所以有待测试.但是简单测试结果是ok的!

对于假定的证明:

官方文档向excel添加图片的流程是:

1.调用workbook的addPicture,并且返回此pictureIndex------>

2.然后创建一个ClientAnchor--------->

3.最后通过这个pictureIndex和Anchor把它绘到sheet上

由此可见pictureIndex,ClientAnchor以及pictureData是一一对应的关系,只要能够关联这三者,就可以获得

Excel中picture的完整信息了.

然而根据poi的api,只能单独获得picture,或者包含pictureIndex和anchor的HSSFPicture,并没有把它们关联在一起.

查看源码发现 HSSFWorkbook只不过是一个外观类,或者适配器类,low level工作类为InternalWorkbook

/**

* this is the reference to the low level Workbook object

*/

private InternalWorkbook workbook;

查看InternalWorkbook有api如下

public EscherBSERecord getBSERecord(int pictureIndex) {

return escherBSERecords.get(pictureIndex-1);

}

此处表明:如果能获得InternalWorkbook对象和pictureIndex,就可以获得图片数据和信息.但是没法通过 HSSFWorkbook对象获得InternalWorkbook对象,因为如下:(此方法为包访问)

InternalWorkbook getWorkbook() {

return workbook;

}

但是观察InternalWorkbook可以发现,如图:

private List escherBSERecords;

保存图像数据的底层是一个List有序的集合.以及根据getBSERecord方法,就推断出picutreIndex就是表示picture在List里面的下标.

以上仅仅是个人的见解,由于对于poi的整体设计理念并没有把握,所以对于以上问题暂时找不到没有一个合理的解释.

分享到:

2011-08-02 15:15

浏览 21197

评论

7 楼

zhang1212

2017-08-29

alex.Lin 写道

for (HSSFShape shape : sheet.getDrawingPatriarch().getChildren()) 取不到外部插入的图片

我也遇到了,请问解决了吗?我换了3.1,3.6,3.7的jar包都不行

6 楼

u010100704

2014-09-03

import org.apache.poi.ss.usermodel.WorkbookFactory; 那个WorkbookFactory是哪里的,我的POI3.9版本,报错啊

5 楼

kyh8408

2012-08-06

有谁知道如何读取excel 2007 中图片及图片所在的行数

4 楼

xufan

2012-05-10

2楼问题怎么解决的啊 》??  能讲下吗? 谢。。。。。。。

3 楼

xufan

2012-05-10

2楼问题怎么解决的啊?

2 楼

lanchedashi

2012-03-26

你好, 这文章非常受用, 不知道有没有关于excel 2007版的相关处理, 我用你的方法找了下源码, 发现XSSF 的没有返回XSSFShape,所以一直找不到和下面这段类似的

for (HSSFShape shape : sheet.getDrawingPatriarch().getChildren()) {

HSSFClientAnchor anchor = (HSSFClientAnchor) shape.getAnchor();

如果你已经解决了这问题, 能不能帮我一下 , 非常感谢!

1 楼

alex.Lin

2011-11-10

for (HSSFShape shape : sheet.getDrawingPatriarch().getChildren()) 取不到外部插入的图片

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值