UA MATH571A 多元线性回归IV 广义线性模型
广义线性模型
Y 1 , Y 2 , . . . , Y N Y_1,Y_2,...,Y_N Y1,Y2,...,YN是服从指数分布族某一分布的被解释变量,并且 E Y i = μ i EY_i=\mu_i EYi=μi,存在某个函数 g g g使得解释变量与 g ( μ i ) g(\mu_i) g(μi)之间具有线性关系
g ( μ i ) = X i β g(\mu_i) = X_i \beta g(μi)=Xiβ
这样的回归模型叫广义线性回归模型。显然当 g ( μ i ) = μ i g(\mu_i)=\mu_i g(μi)=μi时,回归模型是多元线性回归,当 g g g是Logistics函数的反函数时,是Logistics回归。
二值被解释变量
回归模型
Y i = X i β + ϵ i Y_i = X_i \beta + \epsilon_i Yi=Xiβ+ϵi
中,有时 Y i = 0 , 1 Y_i = 0,1 Yi=0,1,这类解释变量叫二值被解释变量,这种回归可以用来做两分类问题。如果把 Y i Y_i Yi视为Bernoulli随机变量,则
p i = P ( Y i = 1 ) = E [ Y i ] = X i β ^ p_i =P(Y_i = 1)= E[Y_i] = X_i \hat{\beta} pi=P(Yi=1)=E[Yi]=Xiβ^
表示的是成功概率。这个模型比较直白,问题也比较多。
- 残差项不满足正态假设
给定样本时,残差只有两个可能的取值,当 Y i = 0 Y_i=0 Yi=0时, ϵ i = − X i β ^ \epsilon_i = -X_i \hat{\beta} ϵi=−Xiβ^,当 Y i = 1 Y_i=1 Yi=1时, ϵ i = 1 − X i β ^ \epsilon_i = 1-X_i \hat{\beta} ϵi=1−Xiβ^,显然这不服从正态分布。 - 同方差假设不成立
残差与 Y i Y_i Yi同分布, σ 2 ( ϵ i ) = − X i β ^ ( 1 − X i β ^ ) \sigma^2(\epsilon_i)=-X_i \hat{\beta}(1-X_i \hat{\beta}) σ2(ϵi)=−Xiβ^(1−Xiβ^),显然与 X i X_i Xi有关,同方差假设不成立。 - 回归方程取值受限
由于拟合值的含义是概率,因此 E [ Y i ] = X i β ^ ∈ [ 0 , 1 ] E[Y_i] = X_i \hat{\beta} \in [0,1] E[Yi]=Xiβ^∈[0,1],否则拟合值无意义。
所以二值被解释变量一般做如下处理。假设 Y i c Y_i^c Yic是一个连续型的变量,但在观测时只取0和1,假设取值的规律为
Y i = 1 , i f Y i c ≤ Y 0 Y i = 0 , i f Y i c > Y 0 Y_i = 1,\ if\ Y_i^c\le Y_0 \\Y_i = 0,\ if\ Y_i^c > Y_0 Yi=1, if Yic≤Y0Yi=0, if Yic>Y0
则
P ( Y i = 1 ) = P ( Y i c ≤ Y 0 ) P(Y_i=1) = P(Y_i^c \le Y_0) P(Yi=1)=P(Yic≤Y0)
假设 Y i c Y_i^c Yic满足线性回归模型
Y i c = X i β + ϵ i , ϵ i ∼ N ( 0 , σ c 2 ) Y_i^c = X_i \beta + \epsilon_i,\ \epsilon_i \sim N(0,\sigma^2_c) Yic=Xiβ+ϵi, ϵi∼N(0,σc2)
则
P ( Y i = 1 ) = P ( Y i c ≤ Y 0 ) = P ( X i β + ϵ i ≤ Y 0 ) = P ( ϵ i ≤ Y 0 − X i β ) = P ( ϵ i σ c ≤ Y 0 σ c − X i β σ c ) P(Y_i=1) = P(Y_i^c \le Y_0) = P(X_i \beta + \epsilon_i \le Y_0 )\\ =P(\epsilon_i \le Y_0 - X_i \beta) = P(\frac{\epsilon_i}{\sigma_c} \le \frac{Y_0}{\sigma_c} - X_i \frac{\beta}{\sigma_c}) P(Yi=1)=P(Yic≤Y0)=P(Xiβ+ϵi≤Y0)=P(ϵi</