人脸比对CNN设计

最新推荐文章于 2024-07-27 13:25:29 发布
tkyjqh
最新推荐文章于 2024-07-27 13:25:29 发布
阅读量7.1k
点赞数 2
分类专栏：机器学习文章标签：人脸比对 CNN 网上资源
本文链接：https://blog.csdn.net/tkyjqh/article/details/70139718
版权
机器学习专栏收录该内容
15 篇文章 1 订阅
订阅专栏
                    
                        
                    
                    一、DeepID学习 
基于Caffe的DeepID2实现 喵耳朵博客2016.10，让你的Caffe支持python层，屏蔽下面配置，然后重新编译。不过最好直接修改Caffe。 
  
 修改的目的主要是适应两个图片的输入。自己实现了ContrastiveLossLayer，LocalNormalization两个层，似乎新版Caffe有这两个层。实现了FaceVerification部分。
 DeepFace–Facebook的人脸识别 雨石博客 2015.7
FaceNet–Google的人脸识别 雨石博客2015.6
DeepID人脸识别算法之三代 雨石博客2014.12
使用Caffe复现DeepID实验 ，DeepID网络配置文件，训练验证数据组织，本实验单模型只有95.45%的准确率，没有到97%左右。主要是人脸分类，不是人脸识别。
《Deep Learning Face Representaion from Predicting 10000 Classes》读书报告，包括两个阶段，一是对输入的人脸块（face patch）用多层卷积网络进行特征提取。一是人脸比对（FaceVerification）输入两张人脸图片，应用多层神经网络或者联合贝叶斯来判定，来判定这两张人脸图片是不是来自同一个人。
基于Caffe的DeepID人脸识别实现 爱程序网，精度有点低，只有82%。但是博客提供了人脸识别的python程序。训练模型未实现FaceVerification部分。 
 out = net.forward_all(data_1 = X) 
 feature1=np.reshape(feature1,(test_num,160)) 
 out = net.forward_all(data_1=X) 
 feature2 = np.float64(out[‘deepid_1’]) 
 mt=pw.pairwise_distances(feature1, feature2, metric=metric)。 
 上述代码的关键是从deepid层读取人脸的特征值（feature）。作者提供了人脸检测、特征点检测、对齐快捷工具FaceTools
DeepID3: Face Recognition with Very Deep Neural Networks 2016.2.3
大裕量Softmax 损失函数，ICML2016 ，Large-Margin Softmax Loss for Convolutional Neural Networks。
人脸识别之caffe-face，也是watersink的博文，该论文为2016年的一篇ECCV，ADiscriminative Feature Learning Approach for Deep Face Recognition。还是深圳先进院乔宇老师组的一篇。不管是思想还是效果都非常的棒。整体流程就是读取输入的图像，然后做个前向传播，应用softmax loss+center loss学习到DiscriminativeFeatures，然后进行标签的预测。 
 softmaxloss可以实现将2个类别分开，center loss可以实现减少类类距离，增加类间距离的效果，有点类似，线性判别分析LDA（Linear Discriminant Analysis）的思想。在效果上优于contrastiveloss和triplet loss，解决了这2个方法在采样问题中的trick。关键点是centerloss的思想 
 看了deploy.prototxt和fac_train_test.prototxt的结构才发现用的是ResNet。作者温研东主页 github
 
二、人脸检测对齐工具 
上述代码的关键是从deepid层读取人脸的特征值（feature）。作者提供了[人脸检测、特征点检测、对齐快捷工具FaceTools]
kpzhang93/MTCNN_face_detection_alignment，对应的python&caffe版本DuinoDu/mtcnn，相关介绍博文人脸检测：MTCNN，tinyZhao博客，MTCNN, WaterSink的博客，作者换了源码的缩放函数bilinear变成bicubic，增加耗时，能够识别第二批右边第二个小人脸。
MTCNN python版本代码有点小问题，在demo.py中一个人脸的Box被画了两次，而且第一次画时坐标顺序错误。
MTCNN python版本代码中的pad函数没有将boxes中的浮点数转换为整型，会报出警告。如下修改：boxes = np.array(boxesA.copy(),dtype = int) ，dx = np.ones(numbox,dtype=int)即可。
人脸数据集百度云，包括Celeb的人脸数据，Cross Age人脸识别，包括一部分数据Cross-Age Celebrity Dataset (CACD)
人脸的姿势估计与各种姿势下的对齐，上海交通大学博士论文
基于Landmark的人脸对齐以及裁剪方法，人生若只如初见博客
opencv 仿射变换 根据眼睛坐标进行人脸对齐 计算变换后对应坐标
人脸旋转剪裁的python代码 Skimage图像选择，缩放。
skimage api文档
MatLab中cp2tform帮助文档，比较详细地介绍了各种transform的算法。比如similarity，affine，polynomial。
Matlab cp2tform函数研究，在caff-face的extractDeepFeature.m代码中用到了cp2tfrom和intransform两个函数将人脸进行对齐。cp2tform函数是根据人脸的5个标记点与标准的5个点作为输入来计算（similarity）转换矩阵。该矩阵的转换公式为： 
 
    
     
     [u v]=[x y 1]∗⎡⎣⎢scsctx−a∗−ss−a∗−ssty⎤⎦⎥ 
     
  

 该矩阵共有5个参数需要确定，因此至少需要两对以上原始点和目标点（将产生至少4个方程），a参数为1或-1，表示是否镜像，如果镜像后坐标与目标坐标的误差范数小则为-1。cp2tform求解过程为： 
 
    
     
     U=X∗rr=inv(X)∗U 
     
  
skimage的Transform包括测试代码，很好学习，还有programtalk网站中的例子，来自kaggle diabetic，最终编程代码包括wrap应用tform进行变换在skimage Similarity应用例子博客中。
YOLO论文记之概述与实践 ，偶然发现的目标检测最新最顶级论文，比R-CNN新。提出一种叫YOLO新的目标检测方法。以前的目标检测的研究大多是改进分离器来进行检测。我们将目标检测的当做一种回归的问题来解决，通过空间的分割成边界框和相应类别的概率。我们采用单独的网络直接从整副图像来预测边界框和类别的概率。因为整个检测在一个网络内，所以它可以直接优化端到端的检测性能。关键点两个，将检测当作回归问题，直接优化端端性能。
camel007/caffe-yolo-face-detection，YOLO系列博客，小小杨_
 
三、人脸比对实现的思路 
分两个模型，一个是人脸特征识别模型，一个是人脸特征比对模型。首先用人脸特征识别模型来学习抽取人脸的特征feature模型，比如DeepID；其次，用人脸特征比对模型来学习根据两张人脸特征进行比对，最简单的比对可用Cos距离比对。其实《Deep Learning Face Representaion from Predicting 10000 Classes》读书报告已经说了这个方法，可是当时竟然没有理解！
深度学习与人脸识别系列（3）基于VGGNet的人脸识别系统 ，wjmishuai博客，直接给出训练好的人脸识别模型，好象有500多M。vgg face网络参数说明博客。wjmishuai的另一篇实时摄像头人脸识别博客,有详细的python代码， 深度学习与人脸识别系列（6）利用训练好的vgg模型进行人脸识别(利用摄像头) ，VggFace python实现问题解答，cv2.cvtColor(img, cv2.COLOR_RGB2BGR)， img = img[:,:,::-1]*255.0 # convert RGB->BGR