提纲:
1.添加0-1变量(LSDV) 原理和指令
2.固定效应模型 原理+指令
3.如何使用F检验,来确定是否使用固定效应模型
一、什么是偶使用固定效应模型?
当存在个体效应or时间效应 且 存在内生性
二、Least squares dummy variable(LSDV) : 添加0-1变量
举例:假设有i个变量,则需要添加i-1个个体效应误差项即可,这种做法是为了避免多重共线性。
那少添加的那个变量的个体效应是不是就被舍去了呢?答:并不是。
因为还有截距项0,所以一共正好有i个截距项,正好一一对应
时间效应同上
三、固定效应模型fixed effects model
(一)总体思路:减去组内平均值
(二)具体操作:(以个体效应为例,时间效应同理。)
(双因素效应模型在后面)
1.求平均值
以每一个个体为一组,求因变量平均值
以每一个个体为一组,求自变量平均值
针对个体效应i求平均值。由于个体效应不随时间变化,因此所求平均值仍是
i
2.上式减下式,如图所示
3.整理可得,式子中已不存在个体效应,此时已经进行OLS回归
双因素效应模型:
(三)Stata指令(两者结果相同,可任意选择)
1. xtreg
xtset 个体变量 时间变量 告诉Stata “个体变量”“时间变量”(注意顺序)
xtreg 因变量 自变量(可能有若干),fe 单因素个体效应固定模型。“fe"是fixed effect缩写
xtreg 因变量 自变量(可能有若干),fe i(month) 单因素时间效应模型
xtreg 因变量 自变量(可能有若干)i.month,fe
双因素固定效应模型。 加了一个时间效应的0-1变量
2.reghdfe(需要自己安装)
ssc install reghdfe 安装指令
reghdfe 因变量 自变量,absord(个体变量 时间变量) 双因素固定效应模型
四、F检验
(一)单因素时间/个体效应模型的检验
在哪里看呢?
以个体效应为例,先在stata操作界面输入单因素个体效应模型的命令。结果的最后一行就是在检验多有的个体效应是不是都为0,(如下图)。若最后的一个p值要<0.05,则我们要拒绝原假设,即我们需要用固定效应模型。反之,不能拒绝原假设,即我们可以使用混合模型。
(二)双因素固定效应模型
1.检验是否存在个体效应:
xtreg 因变量 自变量(可能有若干)i.month,fe
双因素固定效应模型。 加了一个时间效应的0-1变量
所得结果的最后一行F对应的P值 ,如果小于0.05,就接受原假设,即模型中存在个体效应。
2:检验是否存在时间效应:
testparm i.month 检验所有时间的0-1变量,看是否都为0。
跑出结果,若F>0.05,即不能拒绝原假设,可以使用混合效应模型。