03网络正则化

最新推荐文章于 2024-04-18 11:10:46 发布

疯狂的荷兰人学3D视觉

最新推荐文章于 2024-04-18 11:10:46 发布

阅读量428

点赞数

文章标签：深度学习正则化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40920290/article/details/80594789

版权

网络正则化方法

L2正则化
L1正则化
L1、L2正则化组合
最大范式约束
随机失活
实践

L2正则化

通过惩罚目标函数中所有参数的平方，即对网络中每个权重w，向目标函数中增加一个 $\frac{1}{2}\lambda {{w}^{2}}$ ，其中 $\lambda$ 为正则化强度.

L2正则化可以理解为它对于大数值的权重向量进行严厉惩罚，倾向于更加分散的权重向量.因为较大的权重数值会被减小，而一些原来为0的数值会增大，即不接近于0，即更为分散.
这使得网络倾向于使用所有输入特征，而不是严重依赖于特征中某些小部分特征.
在梯度下降和参数更新的时候，使用L2正则化意味着所有的权重w += -lambda*W向着0线性下降.

L1正则化

对于每个 $w$ ,我们向目标函数增加一个 $\lambda \left| w \right|$ .

L1正则化会让权重向量在最优化过程中变得稀疏(即非常接近于0).
使用L1正则化的神经元最后使用的是它们最重要的输入数据的稀疏子集，对于噪声输入则几乎一成不变.

L1、L2正则化组合

L1、L2正则化也可以进行组合，叫做Elastic net regularization. ${{\lambda }_{1}}\left| w \right|+{{\lambda }_{2}}{{w}^{2}}$

最大范式约束

随机失活

正向随机失活

反向随机失活

前向传播中的噪声

实践

通过交叉验证获得一个全局使用L2正则化强度是比较常见的.在使用L2正则化的同时在所有层后面使用随机失活也很常见.p值一般默认设为0.5，也可能在验证集上调参.

疯狂的荷兰人学3D视觉

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。