Stanford机器学习 -- Regularization 的学习

最新推荐文章于 2024-10-06 12:11:29 发布

lovelan2014

最新推荐文章于 2024-10-06 12:11:29 发布

阅读量5.2k

点赞数

分类专栏： Machine Learning 文章标签：机器学习

本文链接：https://blog.csdn.net/u013556011/article/details/46917235

版权

Machine Learning 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

The problem of overfitting

Linear Regression 和 Logistic Regression 可以解决很多的现实问题，但是有时它们也会遇到一些问题，那就是Overfitting(过拟合)的问题，可能会导致它们的效果变差。
解决过拟合问题的一个可行途径是 Regularization(正规化)的技术，它可以改善或减少过度拟合的问题，从而使算法的表现更好(更接近现实中的表现)。
先说明什么是过拟合问题：(用预测房价的例子)

这里写图片描述

在上面我们训练了三个hypothesis 从低次（左）到高次（右）
第一个图说明：数据中表现是租房价格随着面积趋于稳定(越往右越平缓)，但拟合曲线却不这么认为，曲线表明房价和面积成正比。所以拟合曲线不能很好的表现数据。这个问题是欠拟合问题（underfitting)也可称为高偏差(high bias)问题，意思是它没有很好的拟合训练数据，拟合曲线对数据有非常大的偏差。
第三个图说明：拟合曲线很好的拟合了数据，这个样本只有四个数据，用一个四次多项式，我们可以很好的拟合数据(可以说没有任何的偏差，拟合曲线对所有的样本都进行了正确的预测)但我们比不认为它是一个好模型。这个问题是过拟合问题(overfitting)也可称为高方差(high variance)问题，这会面临函数太过庞大的问题。
第二个图说明：正好合适。

这里写图片描述

过拟合就是说：训练的方程总数能很好的拟合训练数据，代价函数J(θ)几乎为零。它对训练集的拟合太好了，以至于它在新的数据上泛化能力不足，指的是一个假设模型能够应用到新样本的能力不足。

这里写图片描述

在逻辑回归中我们也面临这样的问题，可以看到第一个图是欠拟合，第三个图是过拟合，在只有很少参数的情况下，参数少于三个时，我们可以通过画图来识别欠拟合问题和过拟合问题。

这里写图片描述

避免overfitting的办法有两个：
1.减少选取的变量数量：用人工选取特征（效率低），用算法选取特征.缺点是：在舍弃特征的同时，也把其中包含的信息一并舍弃。
2.应用regularization 技术。

Cost Function

这里写图片描述

正规化的思想其实就是对参数做惩罚，让拟合曲线变的更圆滑，有更强的泛化能力。
在上图中，加入了对 theta3 和 theta4 的惩罚，拟合曲线由蓝色变成粉红色，而且最后得到的theta3 和 theta4 大概接近于零。
更一般的表示是

这里写图片描述

这是在Linear regression 和 Logisitic regression 中广泛应用的增加了正规化的代价函数的表现形式。
λ是正规化参数，它在两个目标之间做平衡，一是想让假设更好的拟合训练数据(即代价函数变小) ，二是保持参数值较小，防止其过拟合。
当λ大时，惩罚加重，更好的实现第二个目标，使假设的形式保持简单
当λ小时，更好的实现第一个目标，但过拟合风险加大
当λ很大时，所有被惩罚的项都趋于零，这时假设就会欠拟合