注意:是嵌入在单元格里的图片,嵌入在单元格里的图片,嵌入在单元格里的图片
会显示这种类似的命令(office好像不支持查看,wps可以查看这个位置显示的图片)
网上好多都说用 _image 提取,经测试,这种方案不适用这种嵌入在单元格里的图片提取(经过查看源码,发现_image,方式也是在压缩包里根据图片名提取的图片,所以这种方式只能实现对excel中所有图片的提取,无法实现对应表格中对应的每一行表格中的图片以及本行内容提取并一一对应的功能)
查阅资料发现,xlsx文件 本质上也是一种特殊的压缩文件,所以,把xlsx文件后缀改成zip,即可得到类似这种结构
在 /xl 下找到 cellimages.xml 文件 ,这个文件就是存放图片和对应名称关系的xml文件
/xl/media 文件夹下存放的是所有嵌入的图片(有重复的只会存一个)
cellimages.xml文件中,下图中圈出来的就是