随机效应模型介绍及实例分析
一、模型定义
1.1引入
在给出模型的具体定义之前先看看下面这个案例
例:为研究家庭背景对学生成绩的影响,考虑了以下三种情形,:
1、假设学生来自A学校,为研究家庭背景对学生成绩的影响,构建了线性模型y=a+bx+u,其中y为学生成绩,a为A校学生成绩的平均水平(截距项),x为学生家庭背景(自变量),u衡量具体学生的成绩差异(随机误差)
2、假设学生来自A,B两校,构建模型y=a+cs+bx+u,s是一个二分变量,c是s的回归系数。
3、假设学生来自不同学校,学校是从全省范围内随机选取的,因为不同学校存在差别,反映在学生的平均成绩是不同的 ,这时模型需要修改为y=a+uj+bx+u(随机效应模型),a表示学校总体的平均成绩,uj是随机变量,表示某校学生的平均成绩与全体学生的平均成绩的差值(好学校为正值,差学校为负值)
通过比较可以发现情形一、学生从A校抽取,学校是固定的,只需要考虑学生之间的差异
情形二、两个固定的学校,即考虑学生之间的差异,也要考虑学校之间的差异
情形三、学生是从全省任意选择的学校里抽取的,学校是任意的,这时我们也要考虑不同学校之间的差异,随机效应模型多了一个效应uj,uj是一个随机变量
一般来说, 究竟把一个效应看作是随机的,还是固定的,这取决于研究的目的和样品取得的方法。随机效应模型仅包括作为固定效应的截距和一组定义的随机效应
1.2模型一般形式
随机效应模型的一般形式可以写成:
{ Y = X β + Z u + ϵ E ( u ) = 0 , V a r ( u ) = Σ ϵ N ( 0 , σ 2 I n ) , 且 与 u 无 关 \begin{cases}\\Y=X{\beta}+Zu+{\epsilon}\\ \\E(u)=0, Var(u)={\Sigma}\\ \\{\epsilon}N(0,{\sigma}^2I_n),且与u无关\\ \end{cases} ⎩⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪