霹雳学习笔记——6.1 ResNet网络结构、BN以及迁移学习

Whalawhala

于 2024-03-13 21:00:19 发布

阅读量492

点赞数 14

文章标签：学习笔记迁移学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Whalawhala/article/details/136663254

版权

本文探讨了ResNet的深度网络结构，如何通过残差模块解决梯度问题，BatchNormalization的作用及其对训练速度和准确性的提升，以及迁移学习如何利用预训练模型在小数据集上快速获得良好效果。

摘要由CSDN通过智能技术生成

一、ResNet结构

ResNet是一个突破一千层的网络架构。主要是卷积层Conv和池化层的堆叠。但是普通的堆叠会使得错误率更高，如下图所述，这是因为会产生梯度消失/梯度爆炸等。（梯度就是增量，有大小有方向）
解决方法：权重初始化、标准化处理、BN
堆叠导致错误率升高堆叠还可能导致退化问题。
解决方法：残差模块residual
在这里插入图片描述两个式子对比，残差模块越多，可以省越多的参数。

网络结构的表格和可视化版。
在这里插入图片描述有的残差结构是实线，有的是虚线。区别？
实线输入输出形状相同，虚线输入输出形状不同。
输入输出形状指的是【高x宽，通道数】

二、Batch Normalization

BN的目的是使我们一批（Batch）feature map满足均值为0，方差为1的分布规律。这样做的目的是使的整个样本集所对应的feature map的数据药满足分布规律，从而加速训练，提升准确率。
具体参考霹雳老师的博文

三、迁移学习

通过使用别人预训练好的模型参数，从而具有以下两点优势。
（但是使用了别人的预训练模型参数，就要注意别人的预处理方式，我们预处理要和他们一样）
优点：

能快速训练出一个理想的结果
当数据集较小时也能跑出不错的结果
逐层学会更精细的信息，最后用全连接层把这些特征联合起来，
底层通用特征的学习，如角点信息、纹理信息等，其他地方也能用，我们迁移过来，也就是把这些训练好的网络参数我们迁移过来，让我们的网络拥有可以识别底层通用特征的能力。
方法3可以载入所有参数，之后全连接层的结点个数设置成我们的分类个数就可以。

关注

14
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
霹雳学习笔记——6.1 ResNet网络结构、BN以及迁移学习

主要是卷积层Conv和池化层的堆叠。但是普通的堆叠会使得错误率更高，如下图所述，这是因为会产生。这样做的目的是使的整个样本集所对应的feature map的数据药满足分布规律，从而加速训练，提升准确率。（但是使用了别人的预训练模型参数，就要注意别人的预处理方式，我们预处理要和他们一样）通过使用别人预训练好的模型参数，从而具有以下两点优势。两个式子对比，残差模块越多，可以省越多的参数。解决方法：权重初始化、标准化处理、BN。输入输出形状指的是【高x宽，通道数】有的残差结构是实线，有的是虚线。
复制链接

扫一扫

Whalawhala CSDN认证博客专家 CSDN认证企业博客

码龄5年

45: 原创

55万+: 周排名

7万+: 总排名

2万+: 访问

: 等级

589: 积分

102: 粉丝

133: 获赞

4: 评论

144: 收藏

私信

关注

热门文章

分类专栏

Pytorch学习笔记 14篇
复试 2篇
上机 2篇
作业 2篇

最新评论

【表情识别阅读笔记】Towards Semi-Supervised Deep FER with An Adaptive Confidence Margin
Hanyaoo: 你有没有复现过？我复现它4000标签时候最高能到83%，但是400标签最高只有43%
土堆学习笔记——P9Transforms（一）（二）
CSDN-Ada助手: 恭喜作者持续创作，土堆学习笔记系列内容丰富，对读者学习P9Transforms有很大帮助。希望作者能够继续分享更多相关内容，比如可以深入探讨P9Transforms的应用场景，或者结合实际案例进行讲解，这样可以更好地帮助读者理解和应用知识。期待作者的下一篇博客！
土堆学习笔记——P12常见的Transforms（一）
CSDN-Ada助手: 恭喜博主第20篇博客的问世！标题中提到的P12P13常见的Transforms一直是我学习中的一大难点，很高兴看到你能够分享关于这个话题的学习笔记。通过你的文章，我收获了很多有关Transforms的知识，对于学习和使用它们有了更清晰的认识。希望你能继续坚持下去，为我们带来更多关于这个话题的内容。对于下一步的创作建议，或许可以探讨一些实际应用中常见的Transforms使用技巧，或者分享一些你自己的实践经验。期待你的下一篇精彩文章！
作业三
Bintou: 乘法逆元要改。gcd不能用了，因为没必要。
第二周作业
Bintou: 好像还行

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。