正则化的意义

最新推荐文章于 2024-07-26 12:18:59 发布

RingoCat

最新推荐文章于 2024-07-26 12:18:59 发布

阅读量8.1k

点赞数 3

分类专栏： ML 文章标签：机器学习数据

本文链接：https://blog.csdn.net/u012978177/article/details/53084978

版权

ML 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

线性回归的损失函数

问题引入：

机器学习中使用「正则化来防止过拟合」到底是一个什么原理？为什么正则化项就可以防止过拟合？

这相当于是给模型参数w 添加了一个协方差为1/alpha 的零均值高斯分布先验。对于alpha =0，也就是不添加正则化约束，则相当于参数的高斯先验分布有着无穷大的协方差，那么这个先验约束则会非常弱，模型为了拟合所有的训练数据，w可以变得任意大不稳定。alpha越大，表明先验的高斯协方差越小，模型约稳定，相对的variance也越小。（via zhihu）

通俗来讲，就是 $λ/(2m)\Omega ( f )$ 是一个与模型 $f$ 有关的参数，如果不加此项，模型必定倾向于最小化损失函数 $J(\theta)$ ，这么一来就很可能发生overfitting。引入该项后，如果模型过于复杂，该项的次数(degree)也更高，引发的惩罚（penalization）值也更大，由此抑制了模型的过度复杂化，λ也被称为惩罚因子。