深度学习之防止过拟合的方法及技巧

最新推荐文章于 2023-08-20 11:42:10 发布

dxwell6

最新推荐文章于 2023-08-20 11:42:10 发布

阅读量531

点赞数

分类专栏：深度学习深度学习资源文章标签：深度学习人工智能机器学习神经网络

本文链接：https://blog.csdn.net/a2352159950/article/details/104055175

版权

深度学习同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

深度学习资源

2 篇文章 1 订阅

订阅专栏

深度学习之防止过拟合的方法及技巧

吴恩达深度学习中关于过拟合的讲解
- 1.L2正则化
- 2.随机失活 (dropout)
其他地方看到的技巧
- 1.一篇公众号关于Kaggle比赛中防止过拟合技巧

此文章旨在总结一些大佬在实战中防止过拟合的方法，仅供参考和学习

吴恩达深度学习中关于过拟合的讲解

1.L2正则化

吴恩达说：标准的方法是L2 正则化，它用来修改你的损失函数，从原来的:
$-\frac{1}{m} \sum\limits_{i = 1}^{m} \large{(}\small y^{(i)}\log\left(a^{[L](i)}\right) + (1-y^{(i)})\log\left(1- a^{[L](i)}\right) \large{)} \tag{1}$
变化为:
$J_{正则化后} = \small \underbrace{-\frac{1}{m} \sum\limits_{i = 1}^{m} \large{(}\small y^{(i)}\log\left(a^{[L](i)}\right) + (1-y^{(i)})\log\left(1- a^{[L](i)}\right) \large{)} }_\text{交叉熵损失函数} + \underbrace{\frac{1}{m} \frac{\lambda}{2} \sum\limits_l\sum\limits_k\sum\limits_j W_{k,j}^{[l]2} }_\text{L2 正则项} \tag{2}$
我对于正则项的理解是反过来的，要防止过拟合就要对每一个梯度Wi都要进行惩罚，原来是Wi=Wi - αdWi，可以加上一个λ/m×Wi（λ是一个系数，用来控制正则化程度，除以m是对m个例子求平均）来限制Wi更新的速度。那么现在就应该是Wi=Wi - α×dWi+λ/mWi。