stata里reghdfe函数在不同固定效应设计下的观测值问题

本文探讨了在使用reghdfe进行回归分析时,为何添加不同交互固定效应会导致观测值数量变化,并提出解决方法,包括singleton问题解释、手动删除与keepsingletons选项的应用。关键概念涉及singleton处理和Correia S.'s Technical Note。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

        最近在修改一篇working paper发现,用reghdfe做回归的时候,在相同的基准模型中添加不同的交互固定效应,模型的观测值数量不同。由于担心审稿人的质疑,进一步讨论了这一问题。

        后来也与学校内其他老师交流,发现也有类似的问题。但是老师的解决思路是通过if e(sample)的方式强行使得各模型回归观测值数量相同。感觉这一方式有点治标不治本,但是查阅了很多中文材料,咨询过一些国内的大佬,好像都没有给一个很好的解释。后来找到一篇参考文献,大致解释清楚了这一函数观测值数量的问题。参考文献如下:

Correia S. Singletons, cluster-robust standard errors and fixed effects: A bad mix[J]. Technical Note, Duke University, 2015, 7.

 总结起来解决这一问题的思路如下:

1.和审稿人argue。观测值数量主要是singleton(大致可以理解为由于虚拟变量过多所导致被完全解释的观测值,在经过匹配的数据里比较常见)的问题,从理论上来说可能对估计有不好的影响。可以引用这篇文章里的一些解释。

2.手动删除singleton。但是这里有一个迭代,因为你删除Singleton的操作本身也会产生新的singleton,导致需要反复删除,处理起来比较麻烦。此外,由于模型设定不同,singleton的数量也不同,因此即便手动删除也无法保证观测值数量相等,因此更建议方法1。

3.加入keepsingletons 选项。原文里也提到,删除singleton虽然能解决一部分问题,但是同样会创造一些新的问题。也可以加入这一选择保留所有的singleton,使得估计结果与areg,xtreg,reg等完全一致。这一方式相对来说最为简单~

评论 17
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

粟智豪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值