RESNET

最新推荐文章于 2025-04-07 21:31:29 发布

星河小当家

最新推荐文章于 2025-04-07 21:31:29 发布

阅读量543

点赞数 1

文章标签：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62917657/article/details/132889588

版权

一般我们会觉得网络越深，特征信息越丰富，模型效果应该越好。但是实验证明，当网络堆叠到一定深度时，会出现两个问题：

梯度消失或梯度爆炸

关于梯度消失和梯度爆炸，其实看名字理解最好：
若每一层的误差梯度小于1，反向传播时，网络越深，梯度越趋近于0
反之，若每一层的误差梯度大于1，反向传播时，网路越深，梯度越来越大

退化问题(degradation problem)：在解决了梯度消失、爆炸问题后，仍然存在深层网络的效果可能比浅层网络差的现象

总结就是，当网络堆叠到一定深度时，反而会出现深层网络比浅层网络效果差的情况。

在ResNet网络的创新点：

提出 Residual 结构（残差结构），并搭建超深的网络结构（可突破1000层）
使用 Batch Normalization 加速训练（丢弃dropout）

http://t.csdn.cn/aYqDM

conv2d这个函数的参数第一个是卷积层深度，输入图片是RGB3色的，32*32大小，所以是深度是3,16是卷积核的个数，尺寸为5*5,卷积后的矩阵尺寸大小为（32-5+2*0）/1（步长默认为1）+1=28

每一步的一个注释

stride作用为2时可以将特征矩阵的高和宽缩减为一半，所以一般maxpool以后深度不变宽高变成了一半，

而1*1的卷积核可以生维度和降维度

跟VggNet类似，ResNet也有多个不同层的版本，而残差结构也有两种对应浅层和深层网络：

ResNet   残差结构
浅层网络   ResNet18/34   BasicBlock
深层网络   ResNet50/101/152   Bottleneck
下图中左侧残差结构称为 BasicBlock，右侧残差结构称为 Bottleneck

对于深层的 Bottleneck，1×1的卷积核起到降维和升维（特征矩阵深度）的作用，同时可以大大减少网络参数。

1.4 降维时的 short cut
观察下图的 ResNet18层网络，可以发现有些残差块的 short cut 是实线的，而有些则是虚线的。

这些虚线的 short cut 上通过1×1的卷积核进行了维度处理（特征矩阵在长宽方向降采样，深度方向调整成下一层残差结构所需要的channel即升维）。

我用到的主要是resnet18，

下面是 ResNet 18/34 和 ResNet 50/101/152 具体的实线/虚线残差结构图：

ResNet 18

YOLOv5和YOLOv8都是优秀的目标检测模型,在人脸表情识别任务上都可以使用,主要区别如下:

架构设计不同 YOLOv5基于YOLOv3和YOLOv4改进而来,使用了一定的注意力机制。YOLOv8则在YOLOv5的基础上,引入了Transformer作为backbone,进一步增强了模型的表示能力。
精度提升在同等计算资源下,YOLOv8的精度明显优于YOLOv5,特别是在小目标检测上有显著提升。
速度表现 YOLOv5的检测速度会更快一些,YOLOv8因引入了Transformer,速度略慢于YOLOv5。
训练时间 YOLOv8的训练时间更长,收敛较慢。

综合来看,YOLOv8的定位和识别精度会优于YOLOv5,更适合对精度要求较高的场景,如人脸表情识别。但其训练和预测速度稍慢。如果对检测速度要求较高,则建议使用YOLOv5。

所以在人脸表情识别任务上,如果追求高精度,建议先用YOLOv8检测出人脸,然后传入表情分类模型。如果需要实时处理,则可考虑使用YOLOv5加快检测速度。

因为需要实时表情处理，所以选择了YOLOv5,

星河小当家

博客等级

码龄4年

6
原创

4
点赞

26
收藏

0
粉丝

关注

私信

热门文章

最新评论

RESNET
CSDN-Ada助手: 恭喜您撰写了关于“RESNET”的第六篇博客！您对于持续创作的热情令人钦佩。从您的标题可以看出，您对RESNET有深入的了解。下一步，我建议您可以探讨一下RESNET在图像识别领域的应用案例，或者对其进行进一步的优化研究。期待您再次带来令人愉快且有启发性的博文！
yolo v5和yolo v8的对比
CSDN-Ada助手: 恭喜您写下了第三篇博客！标题《yolo v5和yolo v8的对比》引起了我的兴趣。您对这两个模型进行对比的内容一定非常有价值。我很期待阅读您的博客，以了解它们之间的差异和优劣势。同时，我也希望您能够继续保持创作的热情，为我们带来更多精彩的文章。对于下一步的创作建议，或许您可以探索一下它们在不同场景下的应用效果，或者比较它们在速度和准确度方面的表现。期待能够看到更多关于深度学习模型对比的精彩内容！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
人脸表情识别目前比较常用的深度学习模型
CSDN-Ada助手: 非常棒的博客！恭喜你写了第四篇博客，标题也很吸引人。你对人脸表情识别目前常用的深度学习模型进行了很好的总结。深度学习在人脸表情识别方面的应用确实非常广泛，而你对各种模型的介绍也很详细。我希望能看到你在接下来的博客中更深入地探讨一些特定的模型，或者分享一些实际案例和应用。同时，如果你能结合实践经验，分享一些对于选择和优化模型的建议，那将会为读者提供更大的帮助。继续保持写作的激情和努力，期待你的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
ALEXNET深度学习笔记
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。