吴恩达《机器学习》笔记——第七章《正则化》

肥胖边缘疯狂蹦迪

已于 2022-05-17 16:38:36 修改

阅读量241

点赞数

分类专栏：机器学习文章标签：机器学习人工智能

于 2022-05-16 13:30:05 首次发布

本文链接：https://blog.csdn.net/qq_43572747/article/details/124753159

版权

机器学习专栏收录该内容

18 篇文章 3 订阅

订阅专栏

7、Regularization（正则化）

7.1 The problem of overfitting（过拟合问题）
7.2 Cost function（代价函数）
7.3 Regularied linear regression（线性回归的正则化）
7.4 Regularized logistic regression（Logistic回归的正则化）

7.1 The problem of overfitting（过拟合问题）

过拟合（Overfitting）：如果有太多的特征，学习器把训练样本学得“太好”了的时候，很可能已经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质，这时会对新的样本预测的很差。

解决过拟合的方法：1，减少特征数。（1）人工手动选择保留哪些特征；（2）模型选择算法自动选择保留哪些特征。但是减少特征数的方法，也舍弃了关于问题的一些信息。2，正则化。保留所有的特征，但是减少参数 $\theta_j$ 的量级/值。当有很多特征的时候表现得很好，每一个特征都对预测起到了一些作用。

7.2 Cost function（代价函数）

“正则化”的思想：Small values for 参数 $\theta_0,\theta_1,\cdots,\theta_n$ 有着以下两个优点：1，预示着更简单的假设函数；2，不容易出现过拟合的问题。正则化的目的就是让尽可能多的参数为0.

修改代价函数，来缩小参数。比如，对于线性回归而言，代价函数修改为 $J(\theta)=\frac{1}{2m}\left[\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)})^2+\lambda\sum_{j=1}^n\theta_j^2\right]$ 注：按照习惯，不对 $\theta_0$ 增加惩罚项。 $\lambda$ 称为正则化参数，如果 $\lambda$ 设置的过大，会造成“欠拟合”，因此要选择一个合适的 $\lambda$ ，后面会讲到很多自动选择正则化参数 $\lambda$ 的方法。

7.3 Regularied linear regression（线性回归的正则化）

这一节就是利用前面讲到的线性回归的“梯度下降法”和“正规方程”，求解加了正则项后的线性回归的代价函数的参数 $\theta$ 。没啥好讲的，只需要类似前面求导就可以得到梯度下降算法；令导数等于 $0$ ，即可得到正规方程。然后利用矩阵的知识，简化成矩阵与向量的算法。

对于正规方程， $\theta=\left(X^TX+\lambda\begin{bmatrix}0 & & & \\& 1 & & \\& & \ddots&\\& & &1 \end{bmatrix}\right)^{-1}X^Ty$ 只要 $\lambda>0$ ， $X^TX+\lambda\begin{bmatrix}0 & & & \\& 1 & & \\& & \ddots&\\& & &1\end{bmatrix}$ 一定可逆。

7.4 Regularized logistic regression（Logistic回归的正则化）

加的正则项和线性回归的正则项一样，都是参数 $\theta$ 的 $L_2$ 范数，求解和前面讲Logistic回归时一样。

肥胖边缘疯狂蹦迪

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吴恩达《机器学习》笔记——第七章《正则化》

7、Regularization（正则化）7.1 The problem of overfitting（过拟合问题）7.2 Cost function（代价函数）7.3 Regularied linear regression（线性回归的正则化）7.4 Regularized logistic regression（Logistic回归的正则化）7.1 The problem of overfitting（过拟合问题）过拟合（Overfitting）：如果有太多的特征，学习器把训练样本学得“太好”了的时
复制链接

扫一扫