神经网络与深度学习课程总结（第三周）

最新推荐文章于 2024-10-31 21:41:03 发布

Mutantur

最新推荐文章于 2024-10-31 21:41:03 发布

阅读量60

点赞数

文章标签：深度学习神经网络人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40035635/article/details/129798036

版权

1.性能优化

1.1 动量法

病态曲率：

动量法：

1.2自适应梯度法

参数自适应：具有较大偏导的参数有较大的学习率，小偏导的参数具有较小的学习率。

特点：

学习率单调递减，后期学习率小导致训练困难甚至提前结束。需要设定初始学习率。

RMSProp

RMSProp解决AdaGrad学习率过度衰减的问题：

Adam：

在RMSProp的基础上，Adam除了加入历史梯度平方的指数衰减平均外还保留了历史梯度的指数衰减平均，相当于动量。

1.3性能优化问题

待解决问题：权值𝐰取何值，指标函数𝐽(𝐰)最小？恰恰是最优化方法中的基本问题：函数最小化。
进一步，我们希望建立迭代形式，并且形式尽量简单，类似基本BP算法。

基本思想：

全局最小点，局部最小点的一阶、二阶条件。

1.4 二阶算法

牛顿法：

2.卷积神经网络

卷积神经网络取得的第一个进步是AlexNet网络，它是在2012年提出的。这里有一些关键的改进：它提出了ReLu，也就是有助于防止消失的梯度问题；它也引入了dropout的概念，使得每层中神经元随机地打开和关闭，防止过拟合。如果你的数据过于相似，它不能够对相似但不同的图像进行分类，因为它过拟合了你的训练数据。
之后，就是VGG Net。其中最大的变化是，添加了更多的层。接下来是ResNet，这是在resin之后的创意。并且改进梯度传播，从而使得反向传播更加容易。进一步解决了梯度消失的问题这之后是DenseNet。DenseNet 提出将网络中每一层的所有块与其他层连接起来。这是一种更复杂的连接策略。网络被设计的越来越深。还有一些计算技巧正在被添加到这些卷积网络上，比如ReLu或dropout或批量标准化（Batch Normalization），从而提升了性能。另外，我们还在网络层之间使用越来越多的连接，但是Hinton说卷积神经网络存在问题。

卷积神经网络的基本概念可以概括为，全连接网络，链接权过多，难算难收敛，同时可能进入局部极小值，也容易产生过拟合问题。因此进行填充操。也就是在矩阵的边界上填充一些值，以增加矩阵的大小，通常用0或者复制边界像素来进行填充。如下图所示。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Mutantur

CSDN认证博客专家 CSDN认证企业博客

码龄7年

3: 原创

145万+: 周排名

163万+: 总排名

348: 访问

: 等级

42: 积分

0: 粉丝

0: 获赞

1: 评论

0: 收藏

私信

关注

热门文章

最新评论

神经网络与深度学习课程笔记（四）
CSDN-Ada助手: 恭喜您再次发表了一篇关于神经网络与深度学习的博客，不断分享自己的学习笔记，真是让人佩服。希望您能够继续坚持写作，分享更多的学习心得和体验。下一步的创作建议是可以尝试结合实际应用案例，从实践中总结经验，为读者提供更多的参考价值。期待您的下一篇作品。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。