逻辑回归知识点整理

最新推荐文章于 2024-02-26 18:05:26 发布

艾菲尔jiejieliu

最新推荐文章于 2024-02-26 18:05:26 发布

阅读量519

点赞数

分类专栏：机器学习算法文章标签：逻辑回归机器学习

本文链接：https://blog.csdn.net/qq_34456260/article/details/98626237

版权

机器学习算法专栏收录该内容

1 篇文章

订阅专栏

逻辑回归笔记整理

逻辑回归（Logistic Regression）

首先需要明确两个概念：

逻辑回归并非回归算法，而是分类算法。“回归”一词来源于最佳拟合（拟合：调整分类边界），可简单理解为用一条直线对一些数据点进行拟合（该线称为最佳拟合直线），而拟合过程称为回归。
logistic分类的思想：根据现有数据对分类边界建立回归公式。

分类问题

对于二分类问题：
$y\epsilon\{0,1\}$ 其中，0表示负例，1表示正例。

对于多分类问题：
$y\epsilon\{0,1,2,3,...,n\}$
若分类器使用的是回归模型，并且模型已经训练好，可设置一个阈值：
若 $h_{\theta}(x)\geq0.5$ ，y属于正例；若 $h_{\theta}(x)<0.5$ ，y属于负例。

对于二分类问题，线性回归模型Hypothesis输出值 $h_{\theta}(x)$ 可以大于1也可以小于0。而对于逻辑回归，Hypothesis输出值介于0到1之间：
$0\leq h_{\theta}(x)\leq1$

代价函数

将Hypothesis输出值界定在0到1之间，需引入函数g，令Hypothesis表示为：
$h_{\theta}(x)=g(\theta^Tx)$

g称为Sigmoid Function或Logisitic Function：
$g(z)=\frac1{1+e^{-z}}$
其函数图形为：
sigmoid函数图
其中， $\theta$ 为参数。综合以上两个式子，可得到LR模型的数学表达式：
$h_{\theta}(x)=\frac1{1+e^{-\theta^Tx}}$

决策边界

假设给定阈值0.5，当 $h_{\theta}(x)\geq0.5$ 时， $y = 1$ ；当 $h_{\theta}(x)<0.5$ 时， $y = 0$ 。对于 $h_{\theta}(x)=g(\theta^Tx)\geq0.5$ ，则 $\theta^Tx\geq0$ ，意味着预估 $y = 1$ ；反之，当预测 $y = 0$ 时， $\theta^Tx<0$ 。
故可认为 $\theta^Tx=0$ 是一个决策边界，当其大于或小于0时，LR分别预测不同的分类结果。如：
$h_{\theta}(x)=g(\theta_0+\theta_1x_1+\theta_2x_2)$
$\theta_0,\theta_1,\theta_2$ ,分别取-3，1，1，当 $-3+x_1+x_2\geq0$ 时， $y = 1$ ，则 $x_1+x_2=3$ 是一个决策边界：
线性决策边界
这是一个线性的决策边界，当 $h_{\theta}(x)$ 更复杂时，可得到非线性的决策边界：
$h_{\theta}(x)=g(\theta_0+\theta_1x_1+\theta_2x_2+\theta_3x_1^2+\theta_4x_2^2)$
$\theta_0,\theta_1,\theta_2,\theta_3,\theta_4$ 分别取值-1，0，0，1，1，当 $x_1^2+x_2^2\geq1$ 时， $y = 1$ ，此时决策边界是一个圆：
非线性决策边界

代价函数（Cost Function）

LR的代价函数为对数似然损失函数：
$\begin{cases} -log( h_{\theta}(x))& \text{if y=1}\\ -log(1- h_{\theta}(x))& \text{if y=0} \end{cases}$
加入惩罚项：
$J(\theta)=\frac1m\sum_{i=1}^{m}Cost(h_{\theta}(x^{(i)}),y^{(i)})$
最终的代价函数公式为：
$J(\theta)=\frac1m\left[\sum_{i=1}^{m}y^{(i)}logh_{\theta}(x^{(i)})+(1-y^{(i)})log(1-h_{\theta}(x^{(i)}))\right]$
取似然函数为：
$L(\theta)=\prod_{i=1}^{m}P(y^{(i)}|x^{(i)};\theta)=\prod_{i=1}^{m}(h_{\theta}(x^{(i)}))^{y^{(i)}}(1-logh_{\theta}(x^{(i)}))^{1-y{(i)}}$
对数似然函数为：
$l(\theta)=logL(\theta)=\sum_{i=1}^{m}\left(y^{(i)}logh_{\theta}(x^{(i)})+(1-y^{(i)})log(1-h_{\theta}(x^{(i)}))\right)$
最大似然估计就是求使 $l(\theta)$ 取最大值时的 $\theta$ 。