ResNet的学习笔记~

最新推荐文章于 2023-04-16 15:17:41 发布

songyuc

最新推荐文章于 2023-04-16 15:17:41 发布

阅读量801

点赞数

分类专栏： CNN学习目标检测 Backbone 文章标签： ResNet

本文链接：https://blog.csdn.net/songyuc/article/details/100408889

版权

目标检测同时被 3 个专栏收录

62 篇文章 3 订阅

订阅专栏

CNN学习

13 篇文章 0 订阅

订阅专栏

Backbone

5 篇文章 0 订阅

订阅专栏

1 前言

今天在学习ResNet~
一直在学习和研究ResNet，不过有些东西一直没有弄懂，觉得还是需要通过实验来验证一下，
今天在学习CS231n时，Yang助教又讲到ResNet，这里我们再来复习和梳理一下ResNet的创作思想~
首先，ResNet解决了一个什么样的问题呢？

2 恒等映射的问题

根据Yang助教的说法，ResNet想要解决的问题是“恒等映射的问题”，
也就是，CNN网络无法拟合恒等映射；

具体来说，就是：何教授认为，“conv+relu+conv”的三层结构无法拟合恒等映射，也就是，函数映射： $\boldsymbol y =\boldsymbol x$ 。
（这里的我们将应变量和自变量都用函数表示，因为从广义看来，机器学习中所拟合的所有映射，最终都可以认为是两个列向量之间的函数映射）
那么实际情况是这样吗？
我们可以跟随吴教授在机器学习中的学习次序，来一一进行分析，
我们在 Machine Leanring课程中，依次学习的机器学习算法分别为：线性回归、逻辑回归和神经网络（NN网络）算法，其中，CNN网络可以看做NN网络的一种简化网络。
首先，我们来看看线性回归，
对于线性回归来说，其模型的函数映射为： $\boldsymbol y =\boldsymbol W \boldsymbol x+b$ ，
可以看到，线性回归是可以拟合恒等映射的，
当 $\boldsymbol W$ 为单位矩阵， $b = 0$ 时，则有 $\boldsymbol y =\boldsymbol W \boldsymbol x+b=\boldsymbol x$ ，即实现了恒等映射；
我们再来看看逻辑回归，

3 PyTorch代码阅读笔记

4 PaddleDetection代码阅读笔记

PaddleDetection中resnet的实现链接PaddleDetection–resnet.py

4.1 Module备注

_conv_norm—也就是conv+norm+relu
这里的_conv_norm也就是“conv+norm+relu”三者的合并；

4 备注

4.1 50层以上的ResNet和50层以下ResNet在实现上有什么区别？

50层以上的ResNet，例如：ResNet-101，使用了Bottleneck的结构，它会使得层数增加4倍，具体来说，就是输出的特征图的channel数是输入特征图channel的4倍，（而一般的Block输入输出的层数相同）,
在PyTorch官方实现中，用 expansion = 4表示这个；
inplanes是输入的维度，对应Conv2d()的in_channels参数；
planes是输出维度，对应BatchNorm2d的num_features参数；

4.2 为什么PyTorch官方实现时，conv函数的 bias = False？

因为PyTorch的官方实现在卷积层后面加入了BN的操作，BN技术中会为参数的分布添加偏置参数，所以就不需要使用conv的bias参数了；

songyuc

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
ResNet的学习笔记~

1 前言今天在学习ResNet~一直在学习和研究ResNet，不过有些东西一直没有弄懂，觉得还是需要通过实验来验证一下，今天在学习CS231n时，Yang助教又讲到ResNet，这里我们再来复习和梳理一下ResNet的创作思想~首先，ResNet解决了一个什么样的问题呢？2 恒等映射的问题根据Yang助教的说法，ResNet想要解决的问题是“恒等映射的问题”，具体来说，就是：何教授认...
复制链接

扫一扫