UA MATH571A 多元线性回归IV 广义线性模型

本文深入探讨了广义线性模型,包括Probit模型和Logit模型,重点阐述了二值被解释变量的回归分析,如二项回归。还介绍了系数的最大似然估计、拟合优度检验(如Pearson卡方、Deviance和Hosmer-Lemeshow检验)以及多值被解释变量的处理方法。
摘要由CSDN通过智能技术生成

广义线性模型

Y 1 , Y 2 , . . . , Y N Y_1,Y_2,...,Y_N Y1,Y2,...,YN是服从指数分布族某一分布的被解释变量,并且 E Y i = μ i EY_i=\mu_i EYi=μi,存在某个函数 g g g使得解释变量与 g ( μ i ) g(\mu_i) g(μi)之间具有线性关系
g ( μ i ) = X i β g(\mu_i) = X_i \beta g(μi)=Xiβ
这样的回归模型叫广义线性回归模型。显然当 g ( μ i ) = μ i g(\mu_i)=\mu_i g(μi)=μi时,回归模型是多元线性回归,当 g g g是Logistics函数的反函数时,是Logistics回归。

二值被解释变量

回归模型
Y i = X i β + ϵ i Y_i = X_i \beta + \epsilon_i Yi=Xiβ+ϵi
中,有时 Y i = 0 , 1 Y_i = 0,1 Yi=0,1,这类解释变量叫二值被解释变量,这种回归可以用来做两分类问题。如果把 Y i Y_i Yi视为Bernoulli随机变量,则
p i = P ( Y i = 1 ) = E [ Y i ] = X i β ^ p_i =P(Y_i = 1)= E[Y_i] = X_i \hat{\beta} pi=P(Yi=1)=E[Yi]=Xiβ^
表示的是成功概率。这个模型比较直白,问题也比较多。

  1. 残差项不满足正态假设
    给定样本时,残差只有两个可能的取值,当 Y i = 0 Y_i=0 Yi=0时, ϵ i = − X i β ^ \epsilon_i = -X_i \hat{\beta} ϵi=Xiβ^,当 Y i = 1 Y_i=1 Yi=1时, ϵ i = 1 − X i β ^ \epsilon_i = 1-X_i \hat{\beta} ϵi=1Xiβ^,显然这不服从正态分布。
  2. 同方差假设不成立
    残差与 Y i Y_i Yi同分布, σ 2 ( ϵ i ) = − X i β ^ ( 1 − X i β ^ ) \sigma^2(\epsilon_i)=-X_i \hat{\beta}(1-X_i \hat{\beta}) σ2(ϵi)=Xiβ^(1Xiβ^),显然与 X i X_i Xi有关,同方差假设不成立。
  3. 回归方程取值受限
    由于拟合值的含义是概率,因此 E [ Y i ] = X i β ^ ∈ [ 0 , 1 ] E[Y_i] = X_i \hat{\beta} \in [0,1] E[Yi]=Xiβ^[0,1],否则拟合值无意义。

所以二值被解释变量一般做如下处理。假设 Y i c Y_i^c Yic是一个连续型的变量,但在观测时只取0和1,假设取值的规律为
Y i = 1 ,   i f   Y i c ≤ Y 0 Y i = 0 ,   i f   Y i c > Y 0 Y_i = 1,\ if\ Y_i^c\le Y_0 \\Y_i = 0,\ if\ Y_i^c > Y_0 Yi=1, if YicY0Yi=0, if Yic>Y0

P ( Y i = 1 ) = P ( Y i c ≤ Y 0 ) P(Y_i=1) = P(Y_i^c \le Y_0) P(Yi=1)=P(YicY0)
假设 Y i c Y_i^c Yic满足线性回归模型
Y i c = X i β + ϵ i ,   ϵ i ∼ N ( 0 , σ c 2 ) Y_i^c = X_i \beta + \epsilon_i,\ \epsilon_i \sim N(0,\sigma^2_c) Yic=Xiβ+ϵi, ϵiN(0,σc2)

P ( Y i = 1 ) = P ( Y i c ≤ Y 0 ) = P ( X i β + ϵ i ≤ Y 0 ) = P ( ϵ i ≤ Y 0 − X i β ) = P ( ϵ i σ c ≤ Y 0 σ c − X i β σ c ) P(Y_i=1) = P(Y_i^c \le Y_0) = P(X_i \beta + \epsilon_i \le Y_0 )\\ =P(\epsilon_i \le Y_0 - X_i \beta) = P(\frac{\epsilon_i}{\sigma_c} \le \frac{Y_0}{\sigma_c} - X_i \frac{\beta}{\sigma_c}) P(Yi=1)=P(YicY0)=P(Xiβ+ϵiY0)=P(ϵi</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值