A Lightened CNN for Deep Face Representation论文笔记

最新推荐文章于 2023-02-03 20:15:11 发布

benniaofei18

最新推荐文章于 2023-02-03 20:15:11 发布

阅读量664

点赞数 1

原文链接http://blog.sina.com.cn/s/blog_a5b8a4420102wypn.html

在 OpenFace项目中看到的有关人脸验证的程序，学习下。

该项目github地址： https://github.com/AlfredXiangWu/face_verification_experiment

首先，实践是检验真理的唯一标准，验证下在lfw上的识别率。项目中提供了作者使用自己的模型提取的lfw数据库中的特征，我把lfw分成train、val两个识别标准数据集(即任何一个算法我都会使用这两个数据集测试识别率)，并写了matlab代码从作者的lfw_features中抽取相应数据集的特征并进行cos距离测量，完成识别。最后的结果是：top1 = 766/776 = 0.9871，top5 = 775/776 =0.9987, top10 = 775/776 =0.9987。我在同样数据集上测过 VGG Face Descriptor，结果是： top1 = 731/776 = 0.942，top5 = 757/776 =0.975, top10 = 760/776 =0.979。当然这可能与前期的对齐操作的精确度有关，但是该算法所提取到的人脸特征具有不错区分性是毋庸置疑的，值得细究下。

看下论文《A Lightened CNN for Deep Face Representation》，粗略浏览下，摘要关键词：a lightened CNN framework、Max-Feature-Map(MFM)。前面的段落主要论述了MFM激活函数相比于Relu的优点，主要是它可以学习紧凑的特征而不是Relu那样稀疏高维的。第三段 Architecture：3.1节介绍了 MFM作为激活函数相比于 Relu 的优点，该激活函数可以参考 maxout networks 、 maxout && network in network。3.2节 The Lighted CNN Network，这里介绍了两种网络结构，model A：4 convolution layers, MFM activation functions, 4 max-pooling layers and 2 fully connected layers which is inspired from AlexNet；model B ：5 convolution layers, 4 Network in Network (NIN) layers, MFM activation functions, 4 max-pooling layers and 2 fully connected layers。下图由caffe中的python/draw_net.py绘制的model A及model B。

博主发现作者github上的模型定义文件和其文献的中描述存在些许不符，但能确定的是MFM激活函数作者是用slice+eltwise的方式实现的，文献tabel1中conv1_1和conv1_2是并列的关系，具体的可以参考这里。

https://github.com/AlfredXiangWu/face_verification_experiment/issues/18

至于 NIN的实现方式，博主暂还未理解。

第四段 Experiments：4.1. Data Preprocessing，作者使用CASIA-WebFace 数据集来训练模型(493,456 face images of 10,575 identities),原图转换为灰度图并且使用5个关键点进行人脸对齐再resize到144*144。作者在github项目上提供了人脸对齐的程序：face_db_align.m。它首先算出两眼的旋转角度，然后对原图做一次仿射变换得到 img_rot。接着计算两眼中心、两嘴角中心在 img_rot中的坐标，并与事先给定的参数 ec_mc_y相除得到缩放尺度 resize_scale并以此计算出 img_resize。这时的img_resize是原图经过旋转缩放得到的。最后根据参数 crop_size 计算出人脸框 box 的四角坐标并得到裁剪图 img_crop。至此人脸对齐操作完成。

最后作者介绍了使用caffe进行模型的训练时的策略及各训练参数的设置。作者对图像的前期处理中没有进行减均值的操作(询问作者得知)，github项目results/LightenedCNN_A_lfw.mat中的特征是256维，博主也是问作者得知A网络的feature层是eltwise6, B网络的feature层是eltwise_fc1, 而不是512维的fc1层。

benniaofei18

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
A Lightened CNN for Deep Face Representation论文笔记

原文链接http://blog.sina.com.cn/s/blog_a5b8a4420102wypn.html 在OpenFace项目中看到的有关人脸验证的程序，学习下。该项目github地址：https://github.com/AlfredXiangWu/face_verification_experiment 首先，实践是检验真理的唯一标准，验证下在lfw上...
复制链接

扫一扫