残差网络简单记录

最新推荐文章于 2024-06-22 16:03:37 发布

独鹿

最新推荐文章于 2024-06-22 16:03:37 发布

阅读量755

点赞数

分类专栏：机器学习深度学习机器视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lijjianqing/article/details/79613498

版权

深度学习同时被 3 个专栏收录

19 篇文章 0 订阅

订阅专栏

14 篇文章 0 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

实验和理论证明，神经网络深度和宽度是表示网络的两个核心因素，但深度比宽度在增加复杂性方面更有效（VGG模型）。但随着网络加深，训练会越来越麻烦，误差信号的多层反向会引起梯度消失（回传过程中训练误差及其微弱），和梯度爆炸（梯度过大，导致训练出现Nan）现象。目前概述梯度这些现象的策略有：权重初始化策略，批量规范化策略。

但随着网络加深，训练误差不降反而升高了，（一般线性能求得好的解，那么它对应的深层网络只是也可以，而不是很差）。所以后面出现了残差网络解决了这个问题。

高速公路网络（highway network）

受lstm中门机制的启发，对前馈网络修正让信息在多层直接高效流动。

设输入x.参数w，输出y,那么通过非线性激活f有：y=f(x,w)

高速公路网络加了转化门和携带门：y=f(x,w)*t(x,w)+x（1-t(x,w)）

保留了输入数据x的强度，控制非线性变换强度，也就是非线性和x的加权组合。对于特定的变换可以退化为常规网络。

深度残差网络：

残差网络f(x,w)=y-x

要学习的f(x,w)是输出经过非线性激活与输入经过非线性激活的差，这两个分支经过简单的整合后在经过非线性激活，形成网络的残差模块。多个残差模块堆叠的网络结构称为残差网络。（不过有时候这种还不是很有效），又出现了改进的残差模块，即经过多层卷积核非线性化后的再与多层之前的某个输入的非线性化做加权组合。

残差网络在输入情况一致的情况下不需要引入额外的计算量。高速公路网络则需要计算携带门和控制门的额外运算。

残差网络可以通过近路来连接梯度信息使得梯度有效传播。其实残差网络是更深的VGG，不过以全局平均汇合代替了VGG网络结构中的全连接，减小了参数，避免了过拟合风险。（全局平均汇合操作代替全连接是思想是在2015年googlenet中提出的）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

独鹿 CSDN认证博客专家 CSDN认证企业博客

码龄12年

323: 原创

3万+: 周排名

5914: 总排名

34万+: 访问

: 等级

6307: 积分

100: 粉丝

143: 获赞

89: 评论

264: 收藏

私信

关注

热门文章

分类专栏

123 1篇
java 20篇
人工智能 6篇
操作系统 19篇
编程算法 51篇
机器学习 14篇
linux 19篇
caffe 5篇
python 76篇
c/c++ 1篇
tensorflow 8篇
深度学习 19篇
leetcode 165篇
数据结构 23篇
机器视觉 10篇
数据库 6篇
链表 18篇
二叉树 22篇
list 16篇
ARRAY 25篇
搜索树 1篇
图像处理 5篇
矩阵遍历 2篇
算法 21篇
剑指offer 9篇
GPU 2篇

最新评论

工业异常检测AnomalyGPT-Demo试跑
PF946: 有人复现test_visa.py了吗
FundationPose4090
南柏良客: 如何跑自己的视频数据呀？这里面有如何获取mesh的代码吗？
工业异常检测AnomalyGPT-训练试跑及问题解决
我是无敌干饭王: pydantic.error_wrappers.ValidationError: 1 validation error for DeepSpeedZeroConfig offload_optimizer -> device value is not a valid enumeration member; permitted: 'none', 'cpu', 'nvme' (type=type_error.enum; enum_values=[<OffloadDeviceEnum.none: 'none'>, <OffloadDeviceEnum.cpu: 'cpu'>, <OffloadDeviceEnum.nvme: 'nvme'>]) 这是deepspeed问题么
工业异常检测AnomalyGPT-Demo试跑
我是无敌干饭王: 运行web_demo提交图片就显示error，报错显示为RuntimeError: probability tensor contains either `inf`, `nan` or element < 0
工业异常检测AnomalyGPT-Demo试跑
我是无敌干饭王: 同问题！！！请问解决了么

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。