ResNet || 残差网络结构学习、Batch Normalization、迁移学习

最新推荐文章于 2024-06-21 10:14:27 发布

山外小楼听夜雨.

最新推荐文章于 2024-06-21 10:14:27 发布

阅读量833

点赞数 1

分类专栏：机器学习算法文章标签：学习 batch 迁移学习

本文链接：https://blog.csdn.net/weixin_42521185/article/details/124537308

版权

14 篇文章 3 订阅

订阅专栏

1 介绍ResNet网络

ResNet在2015年由微软实验室提出，斩获当年ImageNet竞赛中分类任务第一名，目标检测第一名。获得COCO数据集目标检测第一名，图像分割第一名。

网络中的亮点：
（1）超深的网络结构（突破1000层）
（2）提出residual模块
（3）使用 Batch Normalization加速训练（丢弃dropout）

在这里插入图片描述

在CNN中，数据格式是 b*c*w*h 的，可以看做是c个二维图片堆叠在一起，每一个都是一个feature map

比如说，红色、绿色和蓝色就分别是3个feature map
卷积之后的feature map：
层与曾之间会有若干个卷积核（kernel）（也是过滤器），比如说最常用的 3×3， 64，表示有 64个 3×3大小的卷积核。
有N个卷积核，那么下层就会产生N个feature map

首先是对数据进行预处理(preprocessing)，调整到满足某一分布规律，这样就能加速了。
但是在conv1 之后，每一个feature map就不满足刚刚的分布规律了，此时就用用到 Batch Normalization 来使得每一个feature map 满足均值为0 方差为1

在这里插入图片描述

在这里插入图片描述

训练时：training=True ，在验证时training=False 在pytorch 中可以在 model.train() 和 model.eval() 方法控制。
batch size 需要尽量大一点，设置太小表现可能很糟糕，设置的越大求的均值和方差越接近整个训练集的均值和方差
建议将BN层，放在卷积层和激活层之间，且卷积层不要设置偏置bias，因为没有用。

在这里插入图片描述

优势：
（1）能够快速的训练处一个理想的结果
（2）当数据集较小时也能训练处理想的效果

注意：使用别人与训练模型参数时，要注意别人的预处理方式。

在这里插入图片描述

https://blog.csdn.net/weixin_42521185/article/details/124542423

https://www.bilibili.com/video/BV14E411H7Uw/?spm_id_from=pageDriver

关注

专栏目录