过拟合与正则化

最新推荐文章于 2024-03-16 20:30:52 发布

东风韶山

最新推荐文章于 2024-03-16 20:30:52 发布

阅读量655

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010439508/article/details/45716563

版权

机器学习中经常遇到所谓的过拟合（overfitting）问题。所谓的过拟合问题, 是指某个模型在训练数据上能够获得比其他模型更好的拟合，但是在训练数据外的数据集上却不能很好的拟合。其本质是，模型对于随机错误或者噪声的刻画超过其对于真实信息的刻画。而出现这种现象的主要原因是训练数据中存在噪音或者训练数据太少。

所谓的正则化，是一种数学方法。它通过在模型中添加针对模型复杂度或者极端参数值的惩罚项来减少模型的过拟合程度。正则化方法可以应用于不同的模型中，包括线性回归、逻辑回归、支持向量机等等。

以线性回归为例，正则化的形式可表示为中的第二项。它其实是模型中各系数的平方和乘以参数 $\lambda$ 。

L (θ) = 1 2 m [\sum i = 1 m (h θ (x (i) - y (i)) 2) + λ \sum j = 1 n θ 2 j] (1-1)

$L(\theta)=\frac{1}{2m}[\sum^{m}_{i=1}(h_{\theta}(x^{(i)}-y^{(i)})^{2})+ \lambda \sum^{n}_{j=1}\theta_{j}^{2}] \tag{1-1}\label{1-1}$

参数lamdda的选择对于模型的性能至关重要：lamda的值过小，将导致正则化的作用微乎其微；lamda的值过大，将导致模型丢失有用的信息，出现所谓的欠拟合。交叉验证通常是确定lamda的值的最直接方法之一。

L1与L2正则化

式所示的即为L2正则。而L2正则化又被成为Ridge regularizer。它将视为惩罚对象。
将模型各系数绝对值的加和视为惩罚对象，被成为L1正则化。

L2正则化认为特征的权重的先验分布是一个0附近的高斯分布
L1正则化认为特征的权重的先验分布是一个0附近的拉普拉斯分布

下图反映了无正则化、L2正则化和L1正则化对于模型系数的影响。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。