【李宏毅机器学习2017】tips for training DNN

最新推荐文章于 2024-09-06 23:56:13 发布

Breau

最新推荐文章于 2024-09-06 23:56:13 发布

阅读量186

点赞数

分类专栏：理论基础文章标签：神经网络机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Breau/article/details/107557019

版权

理论基础专栏收录该内容

3 篇文章 0 订阅

订阅专栏

本次课程的目录：
在这里插入图片描述

激活函数

使用sighmoid函数容易造成梯度消失的原因是：
DNN中，越靠近输出层的权重的梯度越大，因此，能更快地学习到位；而越靠近输入的权重梯度越小，几乎都是随机的。
sigmoid函数所表示的映射关系，决定了w造成的变化在逐层传递的过程中会逐级减弱。
在这里插入图片描述

ReLU

在这里插入图片描述
relu会使得计算过程中一部分神经元的输出变为0（相当于剔除），而另一部分神经元则变成线性神经元。这样，总体的网络还是非线性的。

Relu的变体：
在这里插入图片描述

Maxout

学习激活函数。（Relu是maxout的一个特例）
此种训练方法可以学习到所有的piecewise linear convex function。

在这里插入图片描述
基本过程：把神经元分组组成新的neuron，取个neuron里最大的值作为该neuron的输出，之后再乘上weight，输入到下一层神经元中。

在这里插入图片描述
只要maxout的weights设置得合适，就可以得到和relu效果相同的a和x的关系函数。

adaptive learning rate（优化器）

adagrad

在这里插入图片描述

RMSProp

在这里插入图片描述

局部最优问题->momentum

每次更新的位移都加上momentum参量，这样可以提高跳出局部最优解的几率。momentum一般是上次的位移。
在这里插入图片描述

Adam

在这里插入图片描述

Early stopping

在验证集loss最低的地方停止。

Regularization

正则化和人脑删除大脑无用连接的机制是类似的。

L2

在这里插入图片描述
0＜(1-ηλ)＜1，因此对于没有用的参数，后面梯度项不起作用，逐渐趋近于0；有用的参数前后两项取得平衡。

L1（lasso回归）

在这里插入图片描述
L1正则化是通过减法使得w接近于0。L2对较大参数的惩罚更强，通过L2训练的参数大部分会聚集在接近0但不为0的地方。
L1训练得到的参数的差距会很大。

Dropout

每次更新参数前，每个神经元都有p%的概率被剔除。
在训练时使用dropout，在测试时不能使用dropout！！且要将网络的权重乘以1-p%。
在这里插入图片描述

dropout操作在训练过程中让网络thinner，同时，等同于下列模型：
在这里插入图片描述

在这里插入图片描述
上述两种结果只有在线性网络下可以划等号，其他时候都是约等于。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【李宏毅机器学习2017】tips for training DNN

本次课程的目录：激活函数使用sighmoid函数容易造成梯度消失的原因是：DNN中，越靠近输出层的权重的梯度越大，因此，能更快地学习到位；而越靠近输入的权重梯度越小，几乎都是随机的。sigmoid函数所表示的映射关系，决定了w造成的变化在逐层传递的过程中会逐级减弱。ReLUrelu会使得计算过程中一部分神经元的输出变为0（相当于剔除），而另一部分神经元则变成线性神经元。这样，总体的网络还是非线性的。Relu的变体：Maxout学习激活函数。（Relu是maxout的一个特例）此种
复制链接

扫一扫

专栏目录

Breau CSDN认证博客专家 CSDN认证企业博客

码龄8年

7: 原创

106万+: 周排名

205万+: 总排名

3万+: 访问

: 等级

191: 积分

5: 粉丝

12: 获赞

2: 评论

32: 收藏

私信

关注

热门文章

分类专栏

最新评论

【李宏毅2017机器学习】Why deep？
CSDN-Ada助手: 非常感谢您分享这篇关于“Why deep？”的博客，它引发了我们对深度学习的思考。我认为对于想要深入了解深度学习的读者来说，一篇介绍深度神经网络模型架构的博客会非常有帮助。因此，我建议您写一篇关于深度神经网络模型架构的博客，介绍常见的模型架构，并且探讨它们的优缺点和应用场景。相信这样的博客会吸引更多读者，让更多人受益于深度学习。期待您的下一篇博客！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
解决已安装模块无法import的问题
Yonggie: 老哥很强，期待后续。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。