神经网络与深度学习总结-第二周

福楷

于 2024-04-07 10:47:36 发布

阅读量161

点赞数 10

文章标签：深度学习神经网络人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_49102677/article/details/137453820

版权

本文介绍了在训练数据集中优化性能的关键技术，如动量法、自适应梯度算法（如Adam）、模型初始化（如Xavier），以及K折交叉验证和Dropout等技巧。动量法通过模拟铁球原理改善SGD的稳定性，而自适应梯度算法如Adam能动态调整学习速率。

摘要由CSDN通过智能技术生成

在训练数据集的过程中，我们常常需要使用一些方式使其性能优化。

常用的方法包括使用动量法，自适应梯度算法等等。

常用的技巧包括模型初始化，训练并测试数据（K折交叉验证）拟合等等。

模型初始化是通过简单的考虑，把所有权值在[-1,1]区间内按均值或高斯分布进行初始化。比如Xavier初始化：为了使得网络中信息更好的流动，每一层输出的方差应该尽量相等。因此需要实现下面的均匀分布：

再者是训练数据，验证数据和测试数据，通常三者的比例为70%，15%，15%或60%，20%和20%

当数据较为庞大时，训练和验证数据的比例可适当减少。

K折交叉验证：原始训练数据被分成K个不重叠的子集。然后执行K次模型训练和验证，每次在K-1个子集上进行训练，并在剩余的一个子集（在该轮中没有用于训练的子集）上进行验证，最后通过对K次实验的结果取平均里估计训练和验证误差。

还有一种技巧时暂退（Dropout）：在整个训练过程的每一次迭代中，标准暂退法包括在计算下一层之前当前层中的一些节点置零。如下图所示：

动量法：

动量法一般用来解决SGD问题：病态曲率。

上图是一个损失函数轮廓示例，在进入以蓝色标记的山沟状之前随机开始，颜色表示损失函数在特定点处的值有多大，红色表示最大值，蓝色表示最小值，要达到最小值，需要穿过山沟，这个区域就是病态曲率。如果把原始的SGD想象成一个纸团在中立作用向下滚动，由于质量小收到山壁弹力的干扰大，导致来回震荡；或者在鞍点处因为质量小速度很快减为0，导致无法离开这块平地。动量方方法相当于把纸团换成了铁球，不容易受到外力的干扰，轨迹更加稳定；同时因为在鞍点出因为惯性的作用，更有可能离开平地。

动量法更新公式：

$v_{t}=\alpha v _{t-1}-\epsilon g_{t}$

$\Delta \theta \leftarrow v_{t}$

$\theta _{t+1}\leftarrow \theta _{t}+\Delta \theta$

自适应梯度算法：

Adaptive Gradient 自适应梯度

参数自适应变化是指具有较大偏导的参数相应有一个较大的学习率，而具有小偏导的参数则对于一个较小的学习率，每个参数的学习率回缩放各参数反比于其历史梯度平方值总和的平方根

Adam算法：加入了历史梯度平方的指数衰减平均（r），计算保留历史梯度的指数衰减平均，相当于动量。

该算法自适应调节学习速率，加速收敛。

关注

10
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
神经网络与深度学习总结-第二周

上图是一个损失函数轮廓示例，在进入以蓝色标记的山沟状之前随机开始，颜色表示损失函数在特定点处的值有多大，红色表示最大值，蓝色表示最小值，要达到最小值，需要穿过山沟，这个区域就是病态曲率。然后执行K次模型训练和验证，每次在K-1个子集上进行训练，并在剩余的一个子集（在该轮中没有用于训练的子集）上进行验证，最后通过对K次实验的结果取平均里估计训练和验证误差。再者是训练数据，验证数据和测试数据，通常三者的比例为70%，15%，15%或60%，20%和20%常用的方法包括使用动量法，自适应梯度算法等等。
复制链接

扫一扫

福楷 CSDN认证博客专家 CSDN认证企业博客

码龄4年

4: 原创

146万+: 周排名

14万+: 总排名

3128: 访问

: 等级

139: 积分

35: 粉丝

98: 获赞

2: 评论

80: 收藏

私信

关注

热门文章

最新评论

神经网络与深度学习第三周总结
CSDN-Ada助手: 恭喜您在神经网络与深度学习领域持续努力，第三周的总结让人印象深刻！希望您能继续保持这样的学习态度和热情，不断深入学习，探索更多有趣的内容。下一步，建议可以尝试结合实际案例或者应用场景，给读者带来更直观、实用的体验。期待您更多精彩的作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
神经网络与深度学习第一周总结
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
神经网络与深度学习第一周总结
瞬间即是永恒: 例子不错。是研究生建模竞赛的么？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。