pytorch学习残差

最新推荐文章于 2024-05-12 18:37:51 发布

kfyong

最新推荐文章于 2024-05-12 18:37:51 发布

阅读量717

点赞数

分类专栏：人工智能学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kfyong/article/details/104938167

版权

人工智能学习笔记专栏收录该内容

24 篇文章 1 订阅

订阅专栏

残差能很好的解决网络梯度弥散的问题。

将网络假设成水管的话，网络层表示为阀门，越往后水管的水量越小，加入残差后，可以理解为，将水管并行，保证每个阀门都能有足够多的水量。

残差实际上是做加法，加入以图像为例， pytorch输入图片是[n,c,h,w]的张量，经过一层网络计算后得到的是[n,c',h',w']，如果做张量加法的话必须保证形状一致，n为批次不会变化，如果用卷积我们可以设计成我们加一个pad=1就保证h/w形状也不变，那么C是最常变动的，这样的话，我们设计网络的时候，c'一般设计成c的倍数（如c=16, 我们设计c'=32），这样张量可以通过广播机制自动变化，可以直接相加

另外有个road（路由的算法），但是他不是数值相加，而是contact的拼接，如（c=16，c'=32,那么结果为48）

对残差进一步改进的话，对每次并行出去的输入信息，加一个权重阀门，这样就是RNN的门的概念了,残差实际是lstm的特例

能加残差的就尽量加上，他是张量加法对计算量影响不大，张量计算量大的是乘法

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pytorch学习残差

残差能很好的解决网络梯度弥散的问题。将网络假设成水管的话，网络层表示为阀门，越往后水管的水量越小，加入残差后，可以理解为，将水管并行，保证每个阀门都能有足够多的水量。残差实际上是做加法，加入以图像为例， pytorch输入图片是[n,c,h,w]的张量，经过一层网络计算后得到的是[n,c',h',w']，如果做张量加法的话必须保证形状一致，n为批次不会变化，如果用卷积我们可以设计...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。