分类： logistic regression

最新推荐文章于 2022-04-06 11:07:53 发布

@yuqing_wang

最新推荐文章于 2022-04-06 11:07:53 发布

阅读量88

点赞数

分类专栏：统计学习（李航）

本文链接：https://blog.csdn.net/weixin_43199124/article/details/111403694

版权

统计学习（李航）专栏收录该内容

12 篇文章 0 订阅

订阅专栏

逻辑回归模型

逻辑分布：
x：continuous variable
累计分布函数： $F(x)=\frac{1}{1+exp(-\frac{(x-\mu)}{\gamma})}$
density function: $f(x)=\frac{exp(-\frac{(x-\mu)}{\gamma})}{\gamma(1+exp(-\frac{(x-\mu)}{\gamma}))^2}$
$f (x)$ 关于 $\mu$ 对称
在这里插入图片描述

模型

input： x
output： Y label（分类）
对于二分类问题：
$p(Y=1|x)=\frac{exp(x^T\beta)}{1+exp(x^T\beta)}$
$p(Y=0|x)=\frac{1}{1+exp(x^T\beta)}$
模型分析：
如果 $x^T\beta\rightarrow \infty$ , $p (Y = 1 ∣ x) = 1$
如果 $x^T\beta\rightarrow -\infty$ , $p (Y = 0 ∣ x) = 1$

广义线性模型：
odds：
$\frac{p(Y=1|x)}{p(Y=0|x)}=exp(x^T\beta)$

log odds：
$x^T\beta$

model estimation

observation:
for the i_th subject, $x_i,y_i)$

表示方法：
$p(x_i,\beta)=p(Y=1|X=x_i)$

maximum likelihood estimation:
独立的伯努利分布

$L(\beta)=\prod _{i=1}^n p_i^{y_i}(1-p_i)^{1-y_i}$
$l(\beta)=\sum _{i=1}^n {y_i}logp_i+{(1-y_i)}log(1-p_i)=\sum _{i=1}^n {y_i}logp(x_i,\beta)+{(1-y_i)}log(1-p(x_i,\beta))=\sum _{i=1}^n {y_i}x_i^T\beta-log(1+exp(x_i^T\beta))$

对似然函数求导：

$\frac{\partial l(\beta) }{\partial \beta}=\sum _{i=1}^n {x_i}(y_i-p(x_i,\beta))$

algorithm：
$\beta^{new}=\beta^{old}-(\frac{\partial^2l(\beta)}{\partial\beta\partial\beta^T})^{-1}\frac{\partial l(\beta)}{\partial \beta}$

$\frac{\partial^2l(\beta)}{\partial\beta\partial\beta^T}=-\sum _{i=1}^n x_i{x_i}^Tp(x_i,\beta)(1-p(x_i,\beta))$

将相关函数进行形式改写
$P=(p(x_1,\beta),\cdots,p(x_n,\beta))^T$
$W=diag(p(x_1,\beta)(1-p(x_1,\beta)),\cdots,p(x_n,\beta)(1-p(x_n,\beta)))$

$\frac{\partial l(\beta) }{\partial \beta}=\sum _{i=1}^n {x_i}(y_i-p(x_i,\beta))=X^T(Y-P)$
$\frac{\partial^2l(\beta)}{\partial\beta\partial\beta^T}=-X^TWX$

如果我们将 $x_i$ 表示为列向量， $X^T=(x_1,\cdots,x_n)$

$\beta^{new}\\=\beta^{old}+(X^TWX)^{-1}X^T(Y-P)\\=(X^TWX)^{-1}X^TW(X\beta^{old}+W^{-1}(Y-P))\\=(X^TWX)^{-1}X^TWZ$
$Z=(X\beta^{old}+W^{-1}(Y-P))$

这个算法被称为iteratively reweighted least squares

comment:
(没有证明过)
1. $\hat{\beta}$ converge to $N(\beta,(X^TWX)^{-1})$
2. likelihood test:
$LR=-2max_{\beta_0}l(\beta_0,\beta_1=0)+2max_{\beta_0,\beta_1}l(\beta_0,\beta_1)=DEV_0-DEV_1$
复杂模型似然值-简单模型似然值
follow $\chi^2(num\ of\ paremeters\ in\ \beta_1)$

multinominal logistic regression

多分类问题： $Y\in \{1,\cdots,K\}$

$p(Y=k|x)=\frac{exp(x^T\beta_k)}{1+exp(x^T\beta_k)}$
$k=1,2,\cdots,K-1$
最后一个类的概率
$1-\sum_{i=1}^{K-1}p(Y=k|x)$

@yuqing_wang

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
分类： logistic regression

逻辑回归模型逻辑分布：x：continuous variable累计分布函数：F(x)=11+exp(−(x−μ)γ)F(x)=\frac{1}{1+exp(-\frac{(x-\mu)}{\gamma})}F(x)=1+exp(−γ(x−μ))1density function: f(x)=exp(−(x−μ)γ)γ(1+exp(−(x−μ)γ))2f(x)=\frac{exp(-\frac{(x-\mu)}{\gamma})}{\gamma(1+exp(-\frac{(x-\mu)}{\ga
复制链接

扫一扫

专栏目录