LFW阅读笔记

        作为一个计算机视觉新入门的小白,第一次尝试写博客,试着记录一下学习状况,也为了自己以后方便查阅。

        LFW(labeled face in the wild),是人脸识别比较常用的数据集,包含了13,233张图片,5749人,其中1680有2张或以上的图片,剩下的4069人只有一张图片,图片的获取,是利用Viola-Jones face detector结合OpenCV从网络获取,并作了初步的处理,手动添加了人名,统一格式为250*250 jpg。附上官网:http://vis-www.cs.umass.edu/lfw/

        其构建目的是为了在不受限环境下的测试人脸识别算法提供方便,在Detection-Alignment-Recognition(DAR) pipline中,完成了Detection部分的工作。官方数据集提供了两种views,view 1:为了试验者用作model selection and algorithm development,分为了两个子集,一个用来训练,一个用来测试。view 2:for performance reporting,官方建议仅在最终reporting的时候使用,以防止算法过度拟合,人为增高准确率(这里不知道理解的准确不准确,如有错误,望指正)。在view 2 下,分为了10个子集,可以任选其中9个来用作训练,剩下的一个用来测试。每次试验,应该独立完成,产生10个对应的不同分类器。最终报告可以以ROC(Receiver Operating Characteristic)曲线和PR(Presicion-Recall)曲线呈现,官方要求至少要给出 准确率期望(estimated mean accuracy)和平均标准差(standard error of the mean),对应公式如下:

期望:

平均标准差:其中,方差为

        官方给出了两种训练方式的原型:

        A: Image-Restricted Training

        在这种方式下,不使用名字(name)作为参考, 比如:(10,12)还有(42,50)这两对都是George_W_Bush,但是并不能直接把(10,42)作为已配对的图像直接加入训练集。但如果是(1,2),(2,3)匹配,则可以认为(1,3)也是匹配的。两种view都支持这种方式。参见pairsDevTrain.txt、pairsDevTest.txt以及 pairs.txt

        B: Unrestricted Training 。

        相比第一种方式,如果出现上述情况,则可以直接把(10,42),(10,50),(12,42),(12,50)都加入数据集中。参见peopleDevTrain.txt 、peopleDevTest.txt,但是训练集和测试集不可以混合使用。在view2数据集中,people.txt支持这种模式,但仅仅是用于生成训练集。

更多的细节,可以参考官网的tech report,如有出入,已官网为准。

————————————————2016年11月2日更新——————————————

理想情况下,应该有足够多的数据来保障训练、校正和测试完全独立完成,LFW数据集采用一定程度的数据复用,来扩大数据集数量,但为了不虚报或者人为提高准确率,官方有如下用法推荐:大致依照如下步骤进行

(1)算法改进或模型选择(algorithm development or model selection)

a)使用view1 训练并测试尽可能多的模型,并做参数调整;

b)保持测试表现最好的模型参数设置(model M*);

(2)展示报告(performance reporting)

a)直接使用view2数据集;

b)循环i=1到10 (for i = 1 to 10)

 i)通过联合view2下 除了 i 子集的所有子集,形成试验 i 的训练集;

ii)将 model M* 的参数设置用于该训练集,生成分类器 i ;

        iii)使用子集 i 作为测试集;

iv)在测试集上记录分类器 i 的结果;

c)用10个分类器的结果计算期望准确率和平均标准差( 参考上面给出的公式);

d)最后,确定使用的是那种方式并报告(image-restricted or unrestricted)。

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值