实现一个遍历文件夹,并排列组合该文件夹下图片的py脚本

本文介绍了一个用Python遍历LFW数据集,寻找包含多张人脸图片的子文件夹,然后从中抽取不同组合,用于生成3万组预期匹配和不匹配的图像集合的脚本。通过os.walk()遍历文件夹,结合itertools.combinations()进行高效组合,以满足AI人脸识别项目的测试需求。
摘要由CSDN通过智能技术生成

一、背景需求

因测试AI人脸识别项目,从LFW图像库中,我们要准备两组数据:

1. 3万组预期结果为“匹配”的图像集合

2. 3万组预期结果为“不匹配”的图像集合

组长让我们写个python脚本自动生成测试图像数据。简单介绍一下LFW,它是无约束自然场景人脸识别数据集,主要测试人脸识别的准确率,该数据集由13000多张全世界知名人士互联网自然场景不同朝向、表情和光照环境人脸图片组成,共有5000多人,其中有1680人有2张或2张以上人脸图片。每张人脸图片都有其唯一的姓名ID和序号加以区分。

二、整理思路

LFW数据集已经在我本地电脑上,它的结构是:一个LFW主文件夹,下面有5000多个以人名命名的子文件夹子文件夹中是对应人名的人脸图片,图片命名规则是人名_0001.jpg.

创建3万组预期匹配的图像集合的过程如下:

  1. 从LFW子文件夹中,找出那些有2张或2张以上人脸图片的文件夹
  2. 从同一人名文件夹中取出不重复的2张人脸图片
  3. 循环取3万组不重复的数据(A_0001.jpg A_0002.jpg与A_0002.jpg A_0001.jpg视为重复数据)
  4. 写入一个txt文件

创建3万组预期不匹配的图像集合的过程如下:

  1. 让LFW子文件夹两两组合(5000多个人名文件夹共有一百多万种组合)
  2. 从组合的2个子文件夹中分别随机取出1张人脸图片
  3. 重复步骤2,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值