算法梳理之逻辑回归

最新推荐文章于 2022-05-20 18:30:11 发布

Grace_Codingbo

最新推荐文章于 2022-05-20 18:30:11 发布

阅读量290

点赞数 3

分类专栏：机器学习算法梳理

本文链接：https://blog.csdn.net/botion/article/details/83089735

版权

机器学习算法梳理专栏收录该内容

2 篇文章 0 订阅

订阅专栏

前面介绍了输入与输出皆为连续值的线性回归，现在介绍一个用于分类的广义线性回归—逻辑回归，将线性回归的结果作为一个联系函数的输入，选择合适的联系函数便可很好的实现分类的目的。
线性回归中回归的目标是使得回归值接近我们的标签，如果我们想让回归的目标为标签的衍生物呢？如对数线性回归 $lny=w^Tx+b$ 。此时实际上是让 $e^{w^Tx+b}$ 逼近 $y$ ，是在求取输入空间到输出空间的非线性函数映射，将线性回归的预测值通过联系函数与真实的预测值联系在了一起。同理，如果此时我们的真实预测值是一个二值结果{0,1},通过何种联系函数能将线性回归的预测值变为二值结果呢？Sigmoid函数便是很理想的一个函数，连续且可微，值域为 $(0, 1)$ ,将Sigmoid作为联系函数后的结果与0.5进行大小比较便可得到一个二值的结果。
在这里插入图片描述
将Sigmoid函数作为联系函数后：
$y=\frac{1}{1+e^{-(w^Tx+b)}}$
有 $ln\frac{y}{1-y}=w^Tx+b$
将 $y$ 视为类的后验概率估计 $p (y = 1 ∣ x)$ 则有：
$ln\frac{p(y=1|x)}{p(x=0|x)}=w^Tx+b$
进一步有：
$p_1=p(y=1|x)=\frac{e^{w^Tx+b}}{1+e^{w^Tx+b}},$
$p_0=p(y=0|x)=\frac{1}{1+e^{w^Tx+b}}$
构建使每个样本属于其真实标记的概率最大的似然函数：
$p(y_i|x_i;w,b)=y_ip_1+y_ip_0$
最大化似然函数相当于最小化 $l(\beta)=\sum_{i=1}^{m}(-y_i{\beta}^T\hat{x_i}+ln(1+e^{{\beta}^T{\hat{x_i}}}))$ 其中 $\beta=(w,b),\hat{x}=(x;1)$ 。
$l(\beta)$ 为高阶可导连续凸函数可以使用梯度下降和牛顿法求解。
在这里插入图片描述