数据分为横截面数据(cross sectional data)和纵向数据(longitudinal data)。纵向数据又分为时间序列数据和面板数据。
OLS的关键假设:
(1)cor(x,残差)=0
(2)残差项的方差独立同分布。残差不满足的情况:
- 自回归(autocorrelation):同一企业在不同时间的残差项相关
- 横向相关:不同企业在同一时间的残差项相关
- 异方差(heteroskedasticity):不同观测点的残差的方差不一样
FE和RE的区别:对截距项的处理。FE中每个截距项都是一个常数,RE的截距项是一个随机变量。
1.固定效应模型(FE)
优点:
固定效应假设那些观测不到的因素不随时间变化,而且反映了每个企业独特的属性,所以我们在统计上可以用一组代表每个企业的虚拟变量来控制这些因素的影响。
缺点:
(1)只能控制不随时间变化的遗漏变量,不能控制那些随时间变化、观测不到的因素对结果的影响
(2)FE除了在控制遗漏变量上有优势,对残差的处理上和OLS没有区别,不处理自回归、横向相关和异方差(稳健标准误可以一定程度上弥补这个缺点)
(3)FE需要自变量和因变量随时间的变化比较显著,当自变量或因变量随时间变化不显著时,不再适用。