ML/DL的正则化方法

最新推荐文章于 2024-08-13 09:21:47 发布

FlyDremever

最新推荐文章于 2024-08-13 09:21:47 发布

阅读量325

点赞数 5

分类专栏： ML&DL 文章标签：机器学习深度学习

本文链接：https://blog.csdn.net/qq_33728095/article/details/106956069

版权

ML&DL 专栏收录该内容

30 篇文章 1 订阅

订阅专栏

正则化方法

在机器学习和深度学习中，正则化的最大作用就是防止过拟合，提高模型的泛化性能，具体的方式就是在原来的损失函数中加入惩罚因子。

解决方式：

增加数据集
减少特征，留下重要的，具有普遍的特征
惩罚不重要的特征。

具体的一些实现方式

数据增强
正则化技术
Dropout
Early Stopping

正则化

L2正则化

L2 正则化就是在损失函数后面加上L2 正则化项:
$\frac{\lambda}{2n}\sum_{i=1}^nw^2_i$
L2的正则化公式：
$L_0 + \frac{\lambda}{2n}\sum_{i=1}^nw^2_i$
其中 $L_0$ 是原始损失函数， $\lambda$ 是正则项系数，其中加入 $\frac 12$ 是为了便于求导简化。
最终得到权值的更新公式：
$\eta \frac\lambda n)w-\eta\frac{\partial L_0}{\partial w}$
其中 $\eta,\lambda ,n$ 分别为学习率，正则系数，样本大小，均为正数，所以 $w$ 的系数是恒小于1的，
可以看出，L2正则化就是用来惩罚特征权值 $w$ 的，也就是所谓的 权值衰减。
更小的 $w$ 作用在原来的模型函数上，相当于降低了模型的复杂度，所以可以防止过拟合。