2021-01-10

最新推荐文章于 2023-02-25 00:17:55 发布

有人爱的攻城狮

最新推荐文章于 2023-02-25 00:17:55 发布

阅读量117

点赞数 1

分类专栏：笔记

本文链接：https://blog.csdn.net/m0_46680770/article/details/112425347

版权

笔记专栏收录该内容

9 篇文章 0 订阅

订阅专栏

线性分类-逻辑回归

逻辑回归和线性回归之间有何联系，又有什么样的不同之处？
不同点：逻辑回归是用来进行分类任务的，而且是典型的二分类，线性回归是用来进行预测的，二者任务的性质是不同的。
联系：逻辑回归是将线性回归的输入值再通过一个激活函数映射成一个概率值，用概率值的大小来进行分类。

由上面的叙述引出第一个问题，逻辑回归所用的激活函数是什么呢？
答：Sigmoid函数，函数的图像由下图所示：在这里插入图片描述 Sigmoid函数的表达式 $Y=\frac{1}{1+e^{-z}}$
Sigmoid函数有什么作用呢？我们先观察一下这个函数，y的取值范围是[0，1]，x的取值范围是负无穷到正无穷，它的作用就是将一个输入值映射到0-1的区间内，我们可以设定一个阈值0.5，大于0.5的就认为属于1，小于0.5的就属于0。
把线性回归和逻辑回归联系起来就是 $y=\frac{1}{1+e^{-(w^Tx+b)}}$

上半部分主要是从直观的层面上去理解一下逻辑回归在做什么事下半部分使用严谨的数学公式来进行推导;

因为逻辑回归主要是二分类任务，暂且就用0和1两个类别进行分类吧
一个数据输入进来分类为1的概率:
$p(y=1|x)=\frac{e^{w^Tx+b}}{1+e^{w^Tx+b}}$ ,为了简便咱可以用 $P_1$ 来替代

分类为0的概率:
1- $p(y=1|x)=p(y=0|x)=\frac{1}{1+e^{w^Tx+b}}$ 用 $p_0$ 来替代

将上述两个式子结合可以写成 $p(y|x)=p_1^yp_0^{1-y}$ ,当然也可以写成 $p(y|x)=yp_1+(1-y)p_0$ ,怎么理解呢？
当y=0时 $p(y|x)=p_0$
当y=1时 $p(y|x)=p_1$

接下来就用到了极大似然估计（MLE）

$\hat{\delta(\omega,b)}=argmax_{\omega,b}\log{p(Y|X)}\\=argmax_{\omega,b}\log{\prod_{i=1}^{N}p(y_{i}\mid{x_{i}})}\\=argmax_{\omega,b}\sum_{i=1}^{N}\log{p(y_{i}\mid{x_{i}})}\\=argmax_{\omega,b}\sum_{i=1}^{N}(y_i\log{p_1}+(1-y_i)\log{p_0})\\=argmax_{\omega,b}\sum_{i=1}^{N}(y_i\log{\frac{e^{w^Tx+b}}{1+e^{w^Tx+b}}}+(1-y_i)\log{\frac{1}{1+e^{w^Tx+b}}})\\=argmax_{\omega,b}\sum_{i=1}^{N}(y_i(\omega^Tx+b)-\log{(1+e^{\omega^Tx+b}}))\\=argmin_{\omega,b}\sum_{i=1}^{N}(-y_i(\omega^Tx+b)+\log{(1+e^{\omega^Tx+b}})$
到目前为止，我们将问题转换成一个凸优化问题，可以使用梯度下降法或者牛顿法求出最优解

有人爱的攻城狮

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2021-01-10

线性分类-逻辑回归逻辑回归和线性回归之间有何联系，又有什么样的不同之处？不同点：逻辑回归是用来进行分类任务的，而且是典型的二分类，线性回归是用来进行预测的，二者任务的性质是不同的。联系：逻辑回归是将线性回归的输入值再通过一个激活函数映射成一个概率值，用概率值的大小来进行分类。由上面的叙述引出第一个问题，逻辑回归所用的激活函数是什么呢？答：Sigmoid函数，函数的图像由下图所示：Sigmoid函数的表达式Y=11+e−zY=\frac{1}{1+e^{-z}}Y=1+e−z1Sigmoid函数
复制链接

扫一扫