什么是广义线性模型
广义线性模型(GLM)假设实验者所量测的随机变数(Y)的分布函数与实验中系统性效应(X,即信息,非噪声)可经由一链接函数(link function)建立起可资解释其相关性的函数。
也就是说可以找到一个链接函数,找出X与Y的相关性。也就是说 E(y)=μ=g−1(Xβ) ,其中Y的期望可以由X的线性函数表示,
指数族分布
模型组合
模式组成[编辑]
广义线性模式包含了以下主要部分:
1. 来自指数族的分布函数
f
。
2. 线性预测子
η=Xβ
。
3. 链接函数
g
使得
E(y)=μ=g−1(η)
。
例如在logistic回归中,我们假设Y服从0-1分布,g为logit函数,所以我们要找到最优的参数 β
为什么使用logit函数?
因为它可以把线性因子 Xβ 的区间映射到(0, 1)上,且微分后的形势容易计算。
一般线性模型是GLM的链接函数为恒等映射时的特殊形式。