dlib ResNet相关知识

最新推荐文章于 2024-02-05 13:36:59 发布

数据艺术家小白学习中

最新推荐文章于 2024-02-05 13:36:59 发布

阅读量546

点赞数

文章标签：深度学习计算机视觉目标检测

本文链接：https://blog.csdn.net/qq_46834466/article/details/125194424

版权

#dlib_face_recognition_resnet_model_v1.dat.bz2

  该模型是一个ResNet网络，有29个conv层。它本质上是来自于He, Zhang, Ren和Sun的论文《Deep残差学习for Image Recognition》的ResNet-34网络的一个版本，去掉了几层，每层过滤器的数量减少了一半。

该网络是在大约300万张面孔的数据集上从零开始训练的。此数据集来自多个数据集。刷脸数据集(http://vintage.winklerbros.net/facescrub.html)， VGG数据集(http://www.robots.ox.ac.uk/~vgg/data/vgg_face/)，然后是我从网上刮来的大量图片。我尽我所能通过删除标签错误来清理数据集，这意味着从VGG中过滤掉了很多东西。我通过反复训练一个人脸识别CNN，然后使用图聚类方法和大量的手工检查来清理数据集。最后，大约一半的图像来自VGG和面部磨砂。此外，数据集中的个体身份的总数是7485。我确保避免与LFW的身份重叠。
网络训练从随机初始化权值开始，并使用结构化的度量损失，试图将所有身份投影到半径为0.6的不重叠球中。损失基本上是一种成对铰链损失，它在小批处理中运行所有对，并包括小批处理级别的硬负挖掘。
所得模型在LFW基准上的平均误差为0.993833，标准差为0.00272732。

深度剩余网络
作者:何开明(http://kaiminghe.com)，
张翔宇，任少卿，
孙健。
微软亚洲研究院(MSRA)
###目录
0. (介绍)(#介绍)
0. 引用
0. 免责声明和已知问题
0. (模型)(#模型)
0. 结果
0. (第三方重新实现)(# third-party-re-implementations)

介绍

该存储库包含了原始模型(ResNet-50, ResNet-101和ResNet-152)，在论文“深度残差学习用于图像识别”(http://arxiv.org/abs/1512.03385)中描述。这些模型是在[ILSVRC] (http://image-net.org/challenges/LSVRC/2015/)和COCO 2015年比赛中使用的，这些比赛在:ImageNet分类、ImageNet检测、ImageNet定位、COCO检测、COCO细分中获得第一名。

网络结构的可视化(来自ethereon):
——[ResNet-50] (http://ethereon.github.io/netscope/ /要点/ db945b393d40bfa26006)
——[resnet - 101] (http://ethereon.github.io/netscope/ /要点/ b21e2aae116dc1ac7b50)
——[resnet - 152] (http://ethereon.github.io/netscope/ /要点/ d38f3e6091952b45198b)