逻辑回归和多项逻辑回归

葫芦娃啊啊啊啊

已于 2022-06-15 21:14:24 修改

阅读量2.4k

点赞数 2

分类专栏：深度学习知识点文章标签：逻辑回归机器学习算法

于 2021-12-09 16:50:09 首次发布

本文链接：https://blog.csdn.net/weixin_51221144/article/details/121831374

版权

深度学习知识点专栏收录该内容

18 篇文章 1 订阅

订阅专栏

文章目录

一、逻辑回归
二、多项逻辑回归
三、问题
- 1.逻辑回归如何处理多标签问题？
- 2.为什么不用平方误差（MSE）作为Logistic回归的损失函数？

一、逻辑回归

逻辑回归模型

逻辑回归(Logistic Regression)是统计中经典的二分类算法，逻辑回归模型如下：
$P(Y=1|x)=\frac{exp(w·x)}{1+exp(w·x)}\tag{1}$

$P(Y=0|x)=\frac{1}{1+exp(w·x)}\tag{2}$

其中，输入 $x=\{x^{(1)},x^{(2)},...,x^{(n)},1\}$ ，输出 $Y\in[0,1]$ ， $w=\{w^{(1)},w^{(2)},...,w^{(n)},b\}$ 。对于给定的 $x$ ，可以求条件概率 $P (Y = 1 ∣ x)$ 和 $P (Y = 0 ∣ x)$ 的值，逻辑回归比较两个结果的大小，将 $x$ 分到概率值较大的一类。

将上面的（1）式进行变换有
$P(Y=1|x)=\frac{exp(w·x)}{1+exp(w·x)}=\frac{1}{1+exp(-w·x)}\tag{3}$
从（3）可以看出逻辑回归就是在线性回归的基础上加了个 $s i g m o i d$ 函数( $f(x)=\frac{1}{1+e^{-x}}$ )

几率(odds)：指该事件发生的概率与该事件不发生的概率的比值，即 $odds=\frac{p}{1-p}$ ，其中 $p$ 为事件发生的概率。该事件的对数几率或 $l o g i t$ 函数是：
$logit(p)=log\frac{p}{1-p}\tag{4}$
将逻辑回归模型的公式（1）和（2）带入（4）可得
$log\frac{P(Y=1|x)}{1-P(Y=1|x)}=log\frac{P(Y=1|x)}{P(Y=0|x)}=w·x\tag{5}$
从式（5）可以看出，在逻辑回归模型中， $Y = 1$ 的对数几率是关于 $x$ 的线性函数。

也就是说在线性回归模型中，输出 $Y$ 是关于输入 $x$ 的线性模型，在逻辑回归模型中输出 $Y$ 的几率是关于 $x$ 的线性模型。

线性函数 $w \cdot x$ 的值域为实数域，通过式（1）将线性函数转换为概率， $w \cdot x$ 的值越大概率值就越接近1， $w \cdot x$ 的值越小概率值就越接近0。

极大似然估计法求w

给定数据集 $T=\{(x_1,y_1),...,(x_N,y_N)\}$ ，令 $P (Y = 1 ∣ x) = p (x)$ ，利用极大似然估计求解模型参数 $w$ ，似然函数为：
$L(w)=\prod_{i=1}^{N}[p(x_i)]^{y_i}[1-p(x_i)]^{1-y_i}\tag{6}$
对数似然函数为：
$logL(w)=\sum_{i=1}^{N}[{y_i}logp(x_i)+(1-y_i)log(1-p(x_i))]\\ =\sum_{i=1}^{N}[{y_i}log\frac{p(x_i)}{1-p(x_i)}+log(1-p(x_i))]\\ =\sum_{i=1}^{N}[{y_i}(w·x_i)-log(1+exp(w·x_i))]\tag{7}$
求解 $l o g L (w)$ 的极大值，得到 $w$ 的估计值。

损失函数

损失函数一般是越小越好，所以取负对数似然，防止求和之后数值过大，再取个平均，损失函数如下：
$\min_wJ(w)=-\frac{1}{N}logL(w)=-\frac{1}{N}\sum_{i=1}^{N}[{y_i}logp(x_i)+(1-y_i)log(1-p(x_i))]\\ =-\frac{1}{N}\sum_{i=1}^{N}[{y_i}(w·x_i)-log(1+exp(w·x_i))]\tag{8}$

梯度下降求解w

有了损失函数，采用梯度下降算法求参数 $w$ ：
$\nabla J(w)=\frac{\partial J(w)}{\partial w}\\ w=w-{\alpha}\nabla J(w)\tag{9}$

二、多项逻辑回归

上面说的逻辑回归适用于二分类，如果遇到多分类任务就要用到多项逻辑回归。

假设因变量 $Y\in\{1,2,...,K\}$ ，那么多项逻辑回归模型为：
$P(Y=k|x)=\frac{exp(w_k·x)}{1+\sum_{j=1}^{K-1}exp(w_j·x)},k\in1,...,K-1\\ P(Y=K|x)=\frac{1}{1+\sum_{j=1}^{K-1}exp(w_j·x)}\tag{10}$
其中， $x\in R^{n+1},w_j,w_k\in R^{n+1}$ 。其实多项逻辑回归就是把逻辑回归中的 $s i g m o i d$ 函数换成了 $s o f t m a x$ ，多项逻辑回归可以表示为：
$p(Y=k|x)=\frac{exp(w_k·x)}{\sum_{j=1}^{K}exp(w_j·x)},k\in1,...,K\tag{11}$
当 $j = K$ 时， $exp(w_K·x)=1$ ，就是（10）式了。