【机器学习】学习笔记（五）之正则化

最新推荐文章于 2023-08-26 15:40:50 发布

Tialyg

最新推荐文章于 2023-08-26 15:40:50 发布

阅读量170

点赞数 1

分类专栏：笔记文章标签：机器学习算法正则化

本文链接：https://blog.csdn.net/qq_42292095/article/details/119712609

版权

笔记专栏收录该内容

29 篇文章 1 订阅

订阅专栏

文章目录

一、正则化

在介绍正则化之前，我们先介绍几个名词：

泛化能力：一个假设模型应用到新样本的能力。
拟合数据：即代价函数为0时，代价为0，从而泛化弱。
欠拟合、过拟合
下面从左到右依次是：欠拟合、拟合的最好、过拟合

就以多项式理解，𝑥 的次数越高，拟合的越好，但相应的预测的能力就可能变差，即泛化能力变弱。

如果我们发现了过拟合问题，应该如何处理？

丢弃一些不能帮助我们正确预测的特征。可以是手工选择保留哪些特征，或者使用一些模型选择的算法来帮忙（例如模型选择算法 PCA）
正则化，保留所有的特征，但是减少参数的大小（magnitude）。

正是那些高次项导致了过拟合的产生，所以如果我们能让这些高次项的系数接近于 0 的话，我们就能很好的拟合了。所以我们要做的就是在一定程度上减小这些参数𝜃 的值，这就是正则化的基本方法。
能防止过拟合问题的假设：
在这里插入图片描述
其中𝜆又称为正则化参数（Regularization Parameter）。注：根据惯例，我们不对𝜃0 进行惩罚。经过正则化处理的模型与原模型的可能对比如下图所示：

如果选择的正则化参数 λ 过大，则会把所有的参数都最小化了，导致模型变成 ℎ𝜃(𝑥) = 𝜃0，也就是上图中红色直线所示的情况，造成欠拟合。
如果我们令 𝜆 的值很大的话，为了使 Cost Function 尽可能的小，所有的 𝜃 的值0（不包括𝜃0）都会在一定程度上减小，则可以避免过拟合的发生。
所以对于正则化，我们要取一个合理的 𝜆 的值，这样才能更好的应用正则化。

二、线性回归的正则化

对于线性回归的求解，我们之前推导了两种学习算法：一种基于梯度下降，一种基于正规方程。
线性回归的正则化的代价函数为：
在这里插入图片描述
正则化线性回归的梯度下降算法的变化在于，每次都在原有算法更新规则的基础上令𝜃值减少了一个额外的值。
我们同样也可以利用正规方程来求解正则化线性回归模型，方法如下所示：

三、逻辑回归的正则化

针对逻辑回归问题，学习过两种优化算法：

1.使用梯度下降法来优化代价函数𝐽(𝜃)
2.更高级的优化算法，需要自己设计代价函数𝐽(𝜃)

逻辑回归的正则化的代价函数为：
在这里插入图片描述

import numpy as np
def costReg(theta, X, y, learningRate):
 theta = np.matrix(theta)
 X = np.matrix(X)
 y = np.matrix(y)
 first = np.multiply(-y, np.log(sigmoid(X*theta.T)))
 second = np.multiply((1 - y), np.log(1 - sigmoid(X*theta.T)))
 reg = (learningRate / (2 * len(X))* np.sum(np.power(theta[:,1:theta.shape[1]],2))
 return np.sum(first - second) / (len(X)) + reg