实现一个遍历文件夹，并排列组合该文件夹下图片的py脚本

最新推荐文章于 2023-07-02 21:21:24 发布

黎扶澈

最新推荐文章于 2023-07-02 21:21:24 发布

阅读量811

点赞数

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22895113/article/details/81814489

版权

本文介绍了一个用Python遍历LFW数据集，寻找包含多张人脸图片的子文件夹，然后从中抽取不同组合，用于生成3万组预期匹配和不匹配的图像集合的脚本。通过os.walk()遍历文件夹，结合itertools.combinations()进行高效组合，以满足AI人脸识别项目的测试需求。

摘要由CSDN通过智能技术生成

一、背景需求

因测试AI人脸识别项目，从LFW图像库中，我们要准备两组数据：

1. 3万组预期结果为“匹配”的图像集合

2. 3万组预期结果为“不匹配”的图像集合

组长让我们写个python脚本自动生成测试图像数据。简单介绍一下LFW，它是无约束自然场景人脸识别数据集，主要测试人脸识别的准确率，该数据集由13000多张全世界知名人士互联网自然场景不同朝向、表情和光照环境人脸图片组成，共有5000多人，其中有1680人有2张或2张以上人脸图片。每张人脸图片都有其唯一的姓名ID和序号加以区分。

二、整理思路

LFW数据集已经在我本地电脑上，它的结构是：一个LFW主文件夹，下面有5000多个以人名命名的子文件夹，子文件夹中是对应人名的人脸图片，图片命名规则是人名_0001.jpg.

创建3万组预期匹配的图像集合的过程如下：

从LFW子文件夹中，找出那些有2张或2张以上人脸图片的文件夹
从同一人名文件夹中取出不重复的2张人脸图片
循环取3万组不重复的数据（A_0001.jpg A_0002.jpg与A_0002.jpg A_0001.jpg视为重复数据）
写入一个txt文件

创建3万组预期不匹配的图像集合的过程如下：

让LFW子文件夹两两组合（5000多个人名文件夹共有一百多万种组合）
从组合的2个子文件夹中分别随机取出1张人脸图片
重复步骤2，

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

黎扶澈 CSDN认证博客专家 CSDN认证企业博客

码龄10年

48: 原创

10万+: 周排名

120万+: 总排名

7万+: 访问

: 等级

603: 积分

36: 粉丝

37: 获赞

5: 评论

200: 收藏

私信

关注

分类专栏

光荣之路 35篇
笔记 25篇
测试理论 5篇
练习题 11篇
python 41篇
Linux 2篇
MYSQL 1篇

最新评论

random函数汇总
黎扶澈: 不好意思，之后转行去了，很久没用这个。我查阅了python官方文档，关于cum_weights的解释有误，它其实是叫累积权重。在python内部，相对权重在进行选择之前会转换为累积权重，例如，相对权重``[10, 5, 30, 5]``相当于累积权重``[10, 15, 45, 50]``。所以例子里面[70,10,5,15]这个数值是有误的
random函数汇总
山山而川2020 回复 mavwang: w权重为正数，即为真。yzw权重为负数，即为假。相当于w为百分百权重，其余权重为0
random函数汇总
mavwang: [code=python] >>> for i in range(10): ... print(random.choices(['x','y','z','w'],cum_weights=[70,10,5,15],k=1)) ... ['w'] ['w'] ['w'] ['w'] ['x'] ['x'] ['w'] ['x'] ['x'] ['x'] [/code] 以上这段random.choices的代码里累加权值为cum_weights=[70,10,5,15]，这个权值并不符合累加关系。但仍然是能跑出来结果的，请问这种情况下xyzw的权值分别是多少呢？
random函数汇总
mavwang: 请问下random.choice那部分里面的如下示例： [code=python] for i in range(10): print(random.choices(['x','y','z','w'],cum_weights=[70,10,5,15],k=1)) [/code][code=python] 这里面累加权重值为cum_weights=[70,10,5,15]，并没有累加关系，这个权值怎么理解？而且代码也允许成功了，这个权值下xyzw的相对权值分别是多少呢？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。