[机器学习笔记]Note5--归一化_归一化代价函数为何是直线-CSDN博客

本文链接：https://blog.csdn.net/lc013/article/details/51694454

本文探讨了机器学习中的过拟合问题及其原因，提出通过特征选择和归一化来缓解。重点讲解了归一化线性回归和逻辑回归的代价函数，包括梯度下降和正规方程的应用，以及如何防止归一化参数过大导致低度拟合。

摘要由CSDN通过智能技术生成

继续是机器学习课程的笔记，这节课会介绍归一化的内容。

过拟合问题

这节课会介绍一个在机器学习过程中经常会遇到的问题–过拟合。通常，当我们有非常多的特征，我们可以学习得到的假设可能非常好地适应训练集，即代价函数可能几乎是0，但是可能会不能推广到新的数据，即泛化能力差，对于新的数据预测结果不理想。这就是过拟合问题。而特征非常多也是发生过拟合问题的一个原因之一。

下面是一个回归问题，分别有3个模型，如下所示：
这里写图片描述

第一个模型是一个线性模型，低度拟合，不能很好地适应我们的训练集；第三个模型是一个四次方的模型，过度拟合，虽然能非常好地适应我们的训练集，但在新输入变量进行预测时可能会效果不好；而中间的模型则是相对最合适的模型。

在回归问题中会有过拟合问题，同样在分类问题也是有过拟合的问题，例子如下所示：
这里写图片描述

同样是第一个模型是线性模型，只能低度拟合，而第三个模型是一个过渡拟合的模型，对新输入变量进行预测时效果会不好，只有中间的模型是最合适的模型。

那么，当发生过拟合的问题时，我们可以采取下面的措施来避免过拟合：
1. 丢弃一些不能帮助我们正确预测的特征：可以是手工选择保留哪些特征或者使用一些模型选择的算法来帮忙(例如PCA);
2. 归一化。保留所有的特征，但是减小参数的大小。

归一化代价函数

在上述回归问题的例子中，对于过拟合的模型是 $h_\theta(x) = \theta_0 + \theta_1x_1+\theta_2x_2^2+\theta_3x_3^3+\theta_4x_4^4$ 。

我们决定要减少 $\theta_3和\theta_4$ 的大小，我们要做的是修改代价函数，在其中对 $\theta_3和\theta_4$ 设置一点惩罚。这样做的话，我们在尝试最小化代价时也需要将这个惩罚纳入考虑中，并最终导致选择较小的 $\theta_3和\theta_4$ 。修改后的代价函数如下：