stata里reghdfe函数在不同固定效应设计下的观测值问题

粟智豪

已于 2024-07-10 13:45:18 修改

阅读量2.2w

点赞数 22

文章标签： stata reghdfe obv 观测值

于 2021-07-14 10:08:26 首次发布

本文链接：https://blog.csdn.net/weixin_44066226/article/details/118720720

版权

本文探讨了在使用reghdfe进行回归分析时，为何添加不同交互固定效应会导致观测值数量变化，并提出解决方法，包括singleton问题解释、手动删除与keepsingletons选项的应用。关键概念涉及singleton处理和Correia S.'s Technical Note。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近在修改一篇working paper发现，用reghdfe做回归的时候，在相同的基准模型中添加不同的交互固定效应，模型的观测值数量不同。由于担心审稿人的质疑，进一步讨论了这一问题。

后来也与学校内其他老师交流，发现也有类似的问题。但是老师的解决思路是通过if e(sample)的方式强行使得各模型回归观测值数量相同。感觉这一方式有点治标不治本，但是查阅了很多中文材料，咨询过一些国内的大佬，好像都没有给一个很好的解释。后来找到一篇参考文献，大致解释清楚了这一函数观测值数量的问题。参考文献如下：

Correia S. Singletons, cluster-robust standard errors and fixed effects: A bad mix[J]. Technical Note, Duke University, 2015, 7.

总结起来解决这一问题的思路如下：

1.和审稿人argue。观测值数量主要是singleton（大致可以理解为由于虚拟变量过多所导致被完全解释的观测值，在经过匹配的数据里比较常见）的问题，从理论上来说可能对估计有不好的影响。可以引用这篇文章里的一些解释。

2.手动删除singleton。但是这里有一个迭代，因为你删除Singleton的操作本身也会产生新的singleton，导致需要反复删除，处理起来比较麻烦。此外，由于模型设定不同，singleton的数量也不同，因此即便手动删除也无法保证观测值数量相等，因此更建议方法1。

3.加入keepsingletons 选项。原文里也提到，删除singleton虽然能解决一部分问题，但是同样会创造一些新的问题。也可以加入这一选择保留所有的singleton，使得估计结果与areg，xtreg，reg等完全一致。这一方式相对来说最为简单～