第六章逻辑回归

最新推荐文章于 2024-05-28 12:28:44 发布

「已注销」

最新推荐文章于 2024-05-28 12:28:44 发布

阅读量151

点赞数

分类专栏：统计机器学习

本文链接：https://blog.csdn.net/xu_ampl/article/details/94844689

版权

统计机器学习专栏收录该内容

26 篇文章 0 订阅

订阅专栏

逻辑回归 (logistic regression)
1. 逻辑分布(logistic distribution)
定义设 $X$ 是连续随机变量， $X$ 服从logistic分布是指， $X$ 具有下列分布函数和密度函数：
$\leqslant x)=\frac{1}{1+\mathrm{e}^{-(x-\mu) / \gamma}}$ $f(x)=F^{\prime}(x)=\frac{\mathrm{e}^{-(x-\mu) / \gamma}}{\gamma\left(1+\mathrm{e}^{-(x-\mu) / \gamma}\right)^{2}}$

式中， $\mu$ 为位置参数， $\gamma>0$ 为形状参数。分布函数 $F (x)$ 其图形是一条 $S$ 形曲线，以点 $\left(\mu, \frac{1}{2}\right)$ 为中心对称，即满足 $F(-x+\mu)-\frac{1}{2}=-F(x+\mu)+\frac{1}{2}$

2. 二项logistic回归模型
定义：二项logistic回归模型是如下条件概率分布：
$\begin{array}{l}{P(Y=1 | x)=\frac{\exp (w \cdot x+b)}{1+\exp (w \cdot x+b)}} \\ {P(Y=0 | x)=\frac{1}{1+\exp (w \cdot x+b)}}\end{array}$ $\in \mathbf{R}^{n}$ 是输入， $\in\{0,1\}$ 是输出， $\in \mathbf{R}^{n}$ 和 $\in \mathbf{R}$ 是参数， $w$ 称为权值向量， $b$ 称为偏置， $\cdot x$ 为 $w$ 和 $x$ 的内积。
记 $w=\left(w^{(1)} w^{(2)}, \cdots, w^{(n)}, b\right)^{\mathrm{T}}, x=\left(x^{(1)}, x^{(2)}, \cdots, x^{(n)}, 1\right)^{\mathrm{T}}$ ，此时 $\begin{aligned} P(Y=1 | x) &=\frac{\exp (w \cdot x)}{1+\exp (w \cdot x)} \\ P(Y=0 | x) &=\frac{1}{1+\exp (w \cdot x)} \end{aligned}$ 如果事件发生的概率是 $p$ ，那么该事件的几率是 $\frac{p}{1-p}$ ，对数几率是 $\operatorname{logit}(p)=\log \frac{p}{1-p}$
于是有上式logistic回归 $\log \frac{P(Y=1 | x)}{1-P(Y=1 | x)}=w \cdot x$ 这表明，在logistic回归模型中，输出 $Y = 1$ 的对数几率是输入 $x$ 的线性函数，即输出 $Y = 1$ 的对数几率是由输入 $x$ 的线性函数表示的模型，即logistic回归模型。通过逻辑斯谛回归模型的定义可将线性函数 $\cdot x$ 转换为概率： $x)=\frac{\exp (w \cdot x)}{1+\exp (w \cdot x)}$

3. 模型参数估计
给定训练数据集 $T=\left\{\left(x_{1}, y_{1}\right),\left(x_{2}, y_{2}\right), \cdots\left(x_{N}, y_{N}\right)\right\}, x_{i} \in \mathbf{R}^{n}, y_{i} \in\{0,1\}$ ，可以应用极大似然估计法估计模型参数，从而得到logistic回归模型
设 $x)=\pi(x), \quad P(Y=0 | x)=1-\pi(x)$
似然函数为 $\prod_{i=1}^{N}\left[\pi\left(x_{i}\right)\right]^{y_{i}}\left[1-\pi\left(x_{i}\right)\right]^{1-y_{i}}$
对数似然函数为 $\begin{aligned} L(w) &=\sum_{i=1}^{N}\left[y_{i} \log \pi\left(x_{i}\right)+\left(1-y_{i}\right) \log \left(1-\pi\left(x_{i}\right)\right)\right] \\ &=\sum_{i=1}^{N}\left[y_{i} \log \frac{\pi\left(x_{i}\right)}{1-\pi\left(x_{i}\right)}+\log \left(1-\pi\left(x_{i}\right)\right)\right] \\ &=\sum_{i=1}^{N}\left[y_{i}\left(w \cdot x_{i}\right)-\log \left(1+\exp \left(w \cdot x_{i}\right)\right]\right.\end{aligned}$ 对 $L (w)$ 求极大值，得到 $w$ 的估计值。问题就变成了以对数似然函数为目标的最优化问题，这里通常采用的方法是梯度下降法及拟牛顿法。
假设 $w$ 的极大似然估计值是 $\hat{\boldsymbol{w}}$ ，那么学习得到的logistic回归模型为 $\begin{aligned} p(Y=1 | x) &=\frac{\exp (\hat{w} \cdot x)}{1+\exp (\hat{w} \cdot x)} \\ P(Y=0 | x) &=\frac{1}{1+\exp (\hat{w} \cdot x)} \end{aligned}$ 4. 多项逻辑斯谛回归(multi-nominal logistic regression model)
假设随机变量 $Y$ 的取值集合是 $\{1,2, \cdots, K\}$ ，那么多项逻辑斯谛回归模型是 $x)=\frac{\exp \left(w_{k} \cdot x\right)}{1+\sum_{k=1}^{K-1} \exp \left(w_{k} \cdot x\right)}, \quad k=1,2, \cdots, K-1$ $x)=\frac{1}{1+\sum_{k=1}^{K-1} \exp \left(w_{k} \cdot x\right)}$ 这里， $\in \mathbf{R}^{n+1}, w_{k} \in \mathbf{R}^{n+1}$

「已注销」

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
第六章逻辑回归

逻辑回归 (logistic regression)1 逻辑分布(logistic distribution)定义设XXX是连续随机变量，XXX服从logistic分布是指，XXX具有下列分布函数和密度函数：F(x)=P(X⩽x)=11+e−(x−μ)/γF(x)=P(X \leqslant x)=\frac{1}{1+\mathrm{e}^{-(x-\mu) / \gamma}}F(x...
复制链接

扫一扫