李沐论文讲解笔记 之 ResNet(residual)

ResNet(residual)

CNN主干网络换成残差学习residual learning

residual connectuon在做什么:

一个残差块:之前学到了x,新加的层就不再从头开始学,直接学h(x)-x  (差)。最后输出 深的F(x)加上浅的x

输出和输入怎么匹配上:

1、添加额外的0,使得他们能够相加。

2、使用投影:使用1*1的卷积层(空间维度上不做任何东西,在通道维度上改变),stride=2,使得输出通道是输入的2倍(因为在Resnet中输出变2倍,输入的高和宽通常会被减半)

短边随机放到256和480:随机性更多一点

第四章:实验

FLOPs:

如果是更高层训练:先把等式降维:通道数256->64,再投影回去(bottleneck)

这样两个算法复杂度差不多了。

如果没学到东西,最后的那些层是可能没有在用。如1000层可能只有前100层有用,后面基本意味着0 。所以需要手动加入这个结果使他更容易训练出来。

SGD精髓:梯度够大,能一直跑,最后结果回比较好。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值