ResNet

0iq2333

已于 2022-03-03 20:08:25 修改

阅读量2.1k

点赞数

分类专栏：从零开始学深度学习文章标签：深度学习机器学习概率论

于 2022-03-03 14:10:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/acm_durante/article/details/123248425

版权

从零开始学深度学习专栏收录该内容

18 篇文章 44 订阅

订阅专栏

一、前言:

在训练时，为什么随着网络深度的增加，会出现错误率更高的情况呢？
- 梯度消失、梯度爆炸现象
  - 假设梯度＜1的时候，在反向传播时，导致越乘越小，逐渐趋近于0
  - 假设梯度>1的时候，在反向传播时，导致越乘越大
- 退化问题
  - 残差结构来解决退化问题

二、Residual结构

1、残差结构初步

低层的神经网络
1. 输入:channel是64,3*3的卷积核，个数为64个。
2. 主分支与shortcut的输出特征矩阵shape必须相同。
高层的神经网络

在这里插入图片描述
1. 第一个卷积层:降维度,将256->64
2. 第二个卷积层:进行卷积
3. 第三个卷积层:升维度,将64->256

2、分析残差结构

这里的实线代表输入和输出的shape不变
下采样:这里的虚线代表输入和输出的shape发生了改变
1. 通过stride=2，使得高度变为原来的一半，通过使用128个卷积核，来使得深度变为原来的二倍
2. shortcut分支使用1*1的卷积核改变了深度，从而保证了主分支与shortcut分支的shape相同，从而可以相加。

3、论文中针对不同的layer的参数

不同层次的参数设置

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ResNet

ResNet学习
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。