机器学习笔记(吴恩达)——逻辑回归

最新推荐文章于 2024-03-06 02:25:04 发布

Pyrs

最新推荐文章于 2024-03-06 02:25:04 发布

阅读量249

点赞数

分类专栏：数据分析与机器学习、深度学习文章标签： python 机器学习深度学习算法逻辑回归

本文链接：https://blog.csdn.net/qq_44589327/article/details/107769758

版权

本文详细介绍了逻辑回归模型，包括假说表示、判定边界、代价函数的定义及其优化，以及正则化的应用，阐述了如何通过正则化防止过拟合，同时探讨了多类别分类问题的解决策略。

摘要由CSDN通过智能技术生成

假说表示

在这里插入图片描述
我们引入一个新的模型，逻辑回归，该模型的输出变量范围始终在0和1之间。逻辑回归模型的假设是：
$h_\theta \left( x \right)=g\left(\theta^{T}X \right)$
其中： $X$ 代表特征向量 $g$ 代表逻辑函数（logistic function)是一个常用的逻辑函数为S形函数（Sigmoid function），公式为： $g\left( z \right)=\frac{1}{1+{ {e}^{-z}}}$ 。

对模型的理解： $g\left( z \right)=\frac{1}{1+{ {e}^{-z}}}$ 。

$h_\theta \left( x \right)$ 的作用是，对于给定的输入变量，根据选择的参数计算输出变量=1的可能性（estimated probablity）即 $h_\theta \left( x \right)=P\left( y=1|x;\theta \right)$

判定边界

现在假设我们有一个模型：

在这里插入图片描述

并且参数 $\theta$ 是向量[-3 1 1]。则当 $-3+{x_1}+{x_2} \geq 0$ ，即 ${x_1}+{x_2} \geq 3$ 时，模型将预测 $y = 1$ 。我们可以绘制直线 ${x_1}+{x_2} = 3$ ，这条线便是我们模型的分界线，将预测为1的区域和预测为 0的区域分隔开。

在这里插入图片描述

假使我们的数据呈现这样的分布情况，怎样的模型才能适合呢？

在这里插入图片描述

因为需要用曲线才能分隔 $y = 0$ 的区域和 $y = 1$ 的区域，我们需要二次方特征： ${h_\theta}\left( x \right)=g\left( {\theta_0}+{\theta_1}{x_1}+{\theta_{2}}{x_{2}}+{\theta_{3}}x_{1}^{2}+{\theta_{4}}x_{2}^{2} \right)$ 是[-1 0 0 1 1]，则我们得到的判定边界恰好是圆点在原点且半径为1的圆形。

我们可以用非常复杂的模型来适应非常复杂形状的判定边界。

代价函数

对于线性回归模型，我们定义的代价函数是所有模型误差的平方和。理论上来说，我们也可以对逻辑回归模型沿用这个定义，但是问题在于，当我们将 ${h_\theta}\left( x \right)=\frac{1}{1+{e^{-\theta^{T}x}}}$ 带入到这样定义了的代价函数中时，我们得到的代价函数将是一个非凸函数（non-convexfunction）。
在这里插入图片描述
这意味着我们的代价函数有许多局部最小值，这将影响梯度下降算法寻找全局最小值。

线性回归的代价函数为：
$J\left( \theta \right)=\frac{1}{m}\sum\limits_{i=1}^{m}{\frac{1}{2}{ {\left( {h_\theta}\left({x}^{\left( i \right)} \right)-{y}^{\left( i \right)} \right)}^{2}}}$