广义估计方程(Generalized Estimating Equation,GEE)是统计历史上非常重要的一个方法,是本篇文章讨论的主题。我们将从传统的广义线性模型开始介绍,指出该方法不能解决的问题,从而引出GEE。
广义线性模型(Generalized Linear Model,GLM):
GLM方法关心的是:当响应变量不服从正态分布,也不连续,应该如何去挖掘隐藏在这样数据中的信息。Nelder & Wedderburn 指出,如果响应变量服从指数族分布时,我们可以通过GLM方法去研究响应变量的均值与自变量之间的协变(Association)。常见的指数分布族包括:正态(连续),0-1(离散),二项(离散),泊松(离散)分布。假设我们有独立响应变量
与自变量矩阵
,且
与
有如下关系:
,
其中
被称作均值函数。同时,我们假设
,
称
为方差函数,而
称作发散参数。需要特别指出的是,
与
在上面提到的,当