深度残差网络_百面机器学习笔记 | 第九章:前向神经网络 | 06 深度残差网络

随着神经网络层数增加,优化困难和梯度消失问题愈发严重。深度残差网络(ResNet)应运而生,通过特殊网络结构设计,解决了深层模型的训练难题,允许构建包含数百甚至数千层的深度模型。ResNet的核心在于其短接机制,将输入直接连接到输出,有效缓解了梯度消失问题,促进了深度学习的发展。
摘要由CSDN通过智能技术生成

0b1bf33d597a894f5d531b4936d1462f.png

随着大数据时代的到来,数据规模日益增加,这使得我们有可能训练更大容量的模型,不断地提升模型的表示能力和精度。深度神经网络的层数决定了模型的容量,然而随着神经网络层数的加深,优化函数越来越陷入局部最优解。同时,随着网络层数的增加,梯度消失的问题更加严重,这是因为梯度在反向传播时会逐渐衰减。

为了改善这一问 题,深度学习领域的研究员们在过去十几年间尝试了许多方法,包括改进训练算 法、利用正则化、设计特殊的网络结构等。其中,深度残差网络(Deep Residual Network,ResNet)是一种非常有效的网络结构改进,极大地提高了可以有效训练 的深度神经网络层数。如今,我们可以利用深度残差网络训练一个拥有成百上千网络层的模型。

ResNet的提出背景和核心理论是什么?

ResNet的提出背景是解决或缓解深层的神经网络训练中的梯度消失问题。假设有一个

层的深度神经网络,如果我们在上面加入一层,直观来讲得到的
层 深度神经网络的效果应该至少不会比L层的差。因为我们简单地设最后一层为前一层的拷贝(用一个恒等映射即可实现),并且其他层维持原来的参数即可。然而在进行反向传播时,我们很难找到这种形式的解。实际上,通过实验发现,层数更深的神经网络反而会具有更大的训练误差。在CIFAR-10数据集上的一个结果如下图所示,56层的网络反而比20层的网络训练误差更大,这很大程度上归结于深度神经网络的梯度消失问题。

f2258b8002cb1ecf3e58be5b56bcdfa4.png
20层网络和56层网络在CIFAR-10数据集上的训练误差和测试误差

为了解释梯度消失问题是如何产生的。回顾第3节推导出的误差传播公式:

66252ae811cd5dc971ed7b2196a6f0f3.png

下式是前向传播的公式:

9e90fefa227d310f5919deee02ed88ab.png

将上式展开一层:

89387d3d383cc859099f9fd498c20a3b.png

可以看到误差传播可以写成

以及导数
连乘的形式。当误差由第L层传播到除了输入以外的第一个隐含层的时候,会涉及非常多的参数和导数的连乘,这时误差很容易产生消失或者膨胀,影响该层参数的正确的学习。因此深度神经网络的拟合和泛化能力较差,有时甚至不如浅层的神经网络模型精度更高。

ResNet调整了网络结构。首先考虑两层神经网络的简单叠加,这时,输入

经过两个网络层的变换得到
,激活函数采用ReLU。反向传播时,梯度将涉及两层参数的交叉相乘,可能会在离输入近的网络层中产生梯度消失的现象。

ResNet把网络结构调整为:既然离输入近的神经网络层较难训练,那么我们可以将它短接到更靠近输入的层。输入

经过两个神经网络的变换得到
,同时也短接到两层之后,最后这个包含两 层的神经网络模块输出
。这样一来,
被设计为只需要拟合输入
目标输出 的残差 ,残差网络的名称也因此而来。如果某一层的输出已经较好的拟合了期望结果,那么多加入一层不会使得模型变得更差,因为该层的输出将直接被短接到两层之后,相当于直接学习了一个恒等映射,而跳过的两层只需要拟合上层输出和目标之间的残差即可。

54e86ddb42c18e91f514ec5cf0732db6.png
ResNet结构示意图
Python网络爬虫与推荐算法新闻推荐平台:网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版) 推荐算法:权重衰减+标签推荐+区域推荐+热点推荐.zip项目工程资源经过严格测试可直接运行成功且功能正常的情况才上传,可轻松复刻,拿到资料包后可轻松复现出一样的项目,本人系统开发经验充足(全领域),有任何使用问题欢迎随时与我联系,我会及时为您解惑,提供帮助。 【资源内容】:包含完整源码+工程文件+说明(如有)等。答辩评审平均分达到96分,放心下载使用!可轻松复现,设计报告也可借鉴此项目,该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的。 【提供帮助】:有任何使用问题欢迎随时与我联系,我会及时解答解惑,提供帮助 【附带帮助】:若还需要相关开发工具、学习资料等,我会提供帮助,提供资料,鼓励学习进步 【项目价值】:可用在相关项目设计中,皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面,可借鉴此优质项目实现复刻,设计报告也可借鉴此项目,也可基于此项目来扩展开发出更多功能 下载后请首先打开README文件(如有),项目工程可直接复现复刻,如果基础还行,也可在此程序基础上进行修改,以实现其它功能。供开源学习/技术交流/学习参考,勿用于商业用途。质量优质,放心下载使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值