小编最近项目中遇到一个大批量Excel数据提取的问题,因为Excel数据中含有图片,所以在程序处理时遇到了困难,小编花了点时间才解决了这个问题,所以在这里mark一下。
1 问题描述
首先来描述一下数据处理的需求,如下图所以是给定Excel表的数据结构(非项目数据,自己构造),数据包括人的照片、身份证号、生日等信息,数据处理的需求是将Excel中的图片提取出来并命名为对应身份证号码保存。
![f951a54317b2e41c0856e6dc3ae0df93.png](https://img-blog.csdnimg.cn/img_convert/f951a54317b2e41c0856e6dc3ae0df93.png)
2 python读取Excel内容
作为一个一个程序员首先想到的就是写一个脚本来实现自动化提取与重命名,于是想编写个python脚本来实现。大体设想就是,下载安装python读取Excel的包,读取sheet中的数据行然后将“照片”列不为空的照片保存为该行“身份证”命名的图片。
用pip安装xlrd后,用如下代码进行数据读入测试:
![358ec49cd767d3e86247b04603a87b3e.png](https://img-blog.csdnimg.cn/img_convert/358ec49cd767d3e86247b04603a87b3e.png)
读取数据后的输出如下: