人工智能02-简单分类问题？逻辑回归！

最新推荐文章于 2024-08-21 16:56:45 发布

想做PM的Janna

最新推荐文章于 2024-08-21 16:56:45 发布

阅读量769

点赞数 30

分类专栏：人工智能文章标签：人工智能分类逻辑回归

本文链接：https://blog.csdn.net/qq_50475642/article/details/136793864

版权

人工智能专栏收录该内容

4 篇文章 0 订阅

订阅专栏

02-逻辑回归

引入

问题：根据余额判断小明是否回去看电影。
训练数据：

余额	-5	-4	-3	-2	-1	1	2	3	4	5
是否看电影（0/1）	0	0	0	0	0	1	1	1	1	1

$Y=0.1364x+0.5\rightarrow y=\begin{cases}1,Y\geq0.5 \\ 0,Y>0.5\end{cases}$
但是，当加入一个数据 $(50, 1)$ 时，数据不对称，其实当 $x = 1$ 时，被预测为 $Y = 0.4888, y = 0$ ，准确率降低！

在这里插入图片描述

不能再使用线性回归！

分类任务

基本框架：
$\left\{ \begin{aligned} y=f(x_1,x_2,\cdots,x_n),y=0,1,\cdots,n-1 \\ \text{判断为类别}I,\text{如果}y=i,i=0,1,\cdots,n-1 \end{aligned} \right.$

逻辑回归

简单逻辑回归

定义：用于解决分类问题的一种模型。根据数据特征或属性，计算其归属于某一类别的概率 $P (x)$ ，根据概率数值判断其所属类别。
主要应用场景：二分类问题

例如引入中的问题，可表示为sigmoid方程：

$P(x)=\frac{1}{1+e^{-x}},y=\begin{cases}1,P(x)\geq0.5\\0,P(x)<0.5\end{cases}$
在这里插入图片描述

其中， $y$ 为类别结果， $P$ 为概率分布函数， $x$ 为特征值。

复杂逻辑回归

在这里插入图片描述

如图，此时为二维问题， $x_1,x_2$ 均作为输入，两个自变量判断 $y_1$ 的概率，此时的概率函数为：
$P(x)=\frac{1}{1+e^{-g(x)}},g(x)=\theta_0+\theta_1x_1+\theta_2x_2$
此时， $g (x)$ 即为图中蓝色线的表达式，该线称为决策边界(Decision Boundary)。许多决策问题即为找出决策边界。

在这里插入图片描述

再举一个栗子，如图决策边界为圆形， $x_1,x_2$ 均作为输入，两个自变量判断概率 $y_1$ ，此时的概率函数为：
$P(x)=\frac{1}{1+e^{-g(x)}},g(x)=\theta_0+\theta_1x_1+\theta_2x_2+\theta_3x_1^2+\theta_4x_2^2$
$\star$ 逻辑回归结合多项式边界函数可解决复杂的分类问题！

损失函数

$J_i=\begin{cases}-\log\left(P\left(x_i\right)\right),y_i=1\\-\log\left(1-P\left(x_i\right)\right),y_i=0 \end{cases}$

$P(x_i)$ 即 $x_i$ 为正样本的概率函数， $x_i$ 的损失函数 $J_i$ 理解：

当 $y_i=1$ 即为正样本，若 $P(x_i)=0$ 时，此时损失极大，随着其接近1，损失减小
当 $y_i=0$ 即为负样本，若 $P(x_i)=1$ 时，此时损失极大，随着其接近0，损失减小

接下来最小化损失函数：
$J=\frac{1}{m}\sum^m_{i=1}J_i=-\frac{1}{m}\left[\sum^m_{i=1}\left(y_i\log{\left(P\left(x_i\right)\right)}\right)+(1-y_i)\log{\left(1-P\left(x_i\right)\right)}\right]$
此时， $P(x)=\frac{1}{1+e^{-g(x)}},g(x)=\theta_0+\theta_1x_1+\cdots$

使用梯度下降法，重复计算直到收敛：
$\begin{Bmatrix} temp_{\theta_j}=\theta_j-\alpha\frac{\partial}{\partial\theta_j}J(\theta)\\ \theta_j=temp_{\theta_j} \end{Bmatrix}$