DeepID实现之论文总结

最新推荐文章于 2022-09-05 22:25:02 发布

crazyeden

最新推荐文章于 2022-09-05 22:25:02 发布

阅读量1.8k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/crazyeden/article/details/79174963

版权

本文对DeepID一代论文进行深入解读，指出训练过程中的关键点，包括使用softmax分类器提升训练难度，通过神经网络学习得到具有泛化的密集特征。训练时对60个patch分别训练60个模型，并在每个训练周期选择错误率最低的模型。在特征提取阶段，通过60个patch和水平翻转得到高维特征。识别阶段结合联合贝叶斯方法和PCA降维进行人脸识别。文章讨论了实现过程中的挑战和注意事项。

摘要由CSDN通过智能技术生成

这里的deepid我是指一代。真的想吐槽论文写得感觉逻辑有点混乱，可能也是我水平太差，前后总要跳着看。

我认为好的文章，应该是反复看反复修改，所以我会不定期的更新自己以前写过的文章，一是在复习自己过去的知识，二是进行升华。

本文需要对deepid原论文有一定的了解，我忽略了一些基础部分，直接给出自己的总结或者疑惑。

论文主要思想：

对一个训练样本来进行判断10000个类中的哪一个，训练一个softmax多元分类器，而不是一个二元分类器，提升了训练难度，利用神经网络的强学习能力，同时学习得到的特征具有一定的泛化能力，deepid层只有160维，远远小于其分类类别，这样会形成压缩之后的密集特征。

训练过程：

论文已经给出具体网络中各个层的参数，网上也有很多，这里我也没有仔细研究，默认他们都是对的。但是文中提到60个patch生成60个ConvNets。刚开始看的时候，60个patch知道如何而来，就是一个图片切出四个大小一样的方形区域这样一共得到5个全局区域，然后分别以五官为中心得到5个局部区域，这样一共得到10个patch。然后又按照三种尺度处理，则得到30种patch，然后对彩色图像和灰度图像分别进行如上操作，则得到60种face patches。但是提到训练60个模型，就不明白了。后来才知道是对60个patch分别进行训练，这里不妨就认为有60组样本，分别进行训练，得到60个模型。论文第四部分实验提到，对于每个训练周期，选择错误率最低的模型，这个不知道如何实现以及这里的意义是什么。因为论文已经提到了需要训练60个模型，然后用全部60个模型进行