ResNet

一、前言:

  1. 在训练时,为什么随着网络深度的增加,会出现错误率更高的情况呢?
    • 梯度消失、梯度爆炸现象
      • 假设梯度<1的时候,在反向传播时,导致越乘越小,逐渐趋近于0
      • 假设梯度>1的时候,在反向传播时,导致越乘越大
    • 退化问题
      • 残差结构来解决退化问题

二、Residual结构

1、残差结构初步

  1. 低层的神经网络
    在这里插入图片描述
    1. 输入:channel是64,3*3的卷积核,个数为64个。
    2. 主分支与shortcut的输出特征矩阵shape必须相同。
  2. 高层的神经网络

在这里插入图片描述
1. 第一个卷积层:降维度,将256->64
2. 第二个卷积层:进行卷积
3. 第三个卷积层:升维度,将64->256

2、分析残差结构

  1. 这里的实线代表输入和输出的shape不变在这里插入图片描述
  2. 下采样:这里的虚线代表输入和输出的shape发生了改变在这里插入图片描述
    1. 通过stride=2,使得高度变为原来的一半,通过使用128个卷积核,来使得深度变为原来的二倍
    2. shortcut分支使用1*1的卷积核改变了深度,从而保证了主分支与shortcut分支的shape相同,从而可以相加。

3、论文中针对不同的layer的参数

  1. 不同层次的参数设置在这里插入图片描述
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值