A Lightened CNN for Deep Face Representation论文笔记

原文链接http://blog.sina.com.cn/s/blog_a5b8a4420102wypn.html

      在 OpenFace项目中看到的有关人脸验证的程序,学习下。
      首先,实践是检验真理的唯一标准,验证下在lfw上的识别率。项目中提供了作者使用自己的模型提取的lfw数据库中的特征,我把lfw分成train、val两个识别标准数据集(即任何一个算法我都会使用这两个数据集测试识别率),并写了matlab代码从作者的lfw_features中抽取相应数据集的特征并进行cos距离测量,完成识别。最后的结果是:top1 = 766/776 = 0.9871,top5 = 775/776 =0.9987, top10 = 775/776 =0.9987。我在同样数据集上测过  VGG Face Descriptor,结果是: top1 = 731/776 = 0.942,top5 = 757/776 =0.975, top10 = 760/776 =0.979。当然这可能与前期的对齐操作的精确度有关,但是该算法所提取到的人脸特征具有不错区分性是毋庸置疑的,值得细究下。
       看下论文《A Lightened CNN for Deep Face Representation》,粗略浏览下,摘要关键词:a lightened CNN framework、Max-Feature-Map(MFM)。前面的段落主要论述了MFM激活函数相比于Relu的优点,主要是它可以学习紧凑的特征而不是Relu那样稀疏高维的。 第三段 Architecture:3.1节介绍了 MFM作为激活函数相比于 Relu 的优点,该激活函数可以参考  maxout networks 、 maxout && network in network。3.2节 The Lighted CNN Network,这里介绍了两种网络结构,model A:4 convolution layers, MFM activation functions, 4 max-pooling layers and 2 fully connected layers which is inspired from AlexNet;model B :5 convolution layers, 4 Network in Network (NIN) layers, MFM activation functions, 4 max-pooling layers and 2 fully connected layers。下图由caffe中的python/draw_net.py绘制的model A及model B。
A <wbr>Lightened <wbr>CNN <wbr>for <wbr>Deep <wbr>Face <wbr>Representation论文笔记

A <wbr>Lightened <wbr>CNN <wbr>for <wbr>Deep <wbr>Face <wbr>Representation论文笔记
博主发现作者github上的模型定义文件和其文献的中描述存在些许不符,但能确定的是MFM激活函数作者是用slice+eltwise的方式实现的,文献tabel1中conv1_1和conv1_2是并列的关系,具体的可以参考 这里
https://github.com/AlfredXiangWu/face_verification_experiment/issues/18
至于 NIN的实现方式,博主暂还未理解。
       第四段 Experiments:4.1. Data Preprocessing,作者使用CASIA-WebFace 数据集来训练模型(493,456 face images of 10,575 identities),原图转换为灰度图并且使用5个关键点进行人脸对齐再resize到144*144。作者在github项目上提供了人脸对齐的程序:face_db_align.m。它首先算出两眼的旋转角度,然后对原图做一次仿射变换得到 img_rot。接着计算两眼中心、两嘴角中心在 img_rot中的坐标,并与事先给定的参数 ec_mc_y相除得到缩放尺度 resize_scale并以此计算出 img_resize。这时的img_resize是原图经过旋转缩放得到的。最后根据参数 crop_size 计算出人脸框 box 的四角坐标并得到裁剪图 img_crop。至此人脸对齐操作完成。
       最后作者介绍了使用caffe进行模型的训练时的策略及各训练参数的设置。作者对图像的前期处理中没有进行减均值的操作(询问作者得知),github项目results/LightenedCNN_A_lfw.mat中的特征是256维,博主也是问作者得知A网络的feature层是eltwise6, B网络的feature层是eltwise_fc1, 而不是512维的fc1层。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值