目录
在统计学和计量经济学中,含协变量的培根分解是一种用于分析和解释数据的重要方法。以下将详细介绍在 Stata 中进行含协变量的培根分解的具体操作步骤,并结合实际数据进行演示。
一、数据准备
我们将使用 Stata 自带的数据集“auto.dta”,该数据集包含了汽车的相关信息。
use "auto.dta", clear
二、模型设定
假设我们要研究汽车价格(price
)与汽车重量(weight
)、里程数(mpg
)之间的关系,同时将汽车制造年份(year
)作为协变量,将汽车的汽缸数(cylinders
)作为控制变量。
reg price weight mpg year i.cylinders
此代码中:
reg
表示进行回归分析。price
是因变量。weight
和mpg
是自变量。year
是协变量。i.cylinders
表示将cylinders
作为分类变量纳入模型。
三、计算残差
predict resid, resid
resid
是新生成的变量,存储了模型的残差。
四、进行培根分解
ssc install bacondecomp
bacondecomp resid year
这将基于协变量 year
对残差进行培根分解。
五、解释结果
运行上述命令后,Stata 会输出分解的结果。结果可能包括以下几个部分:
- 分解的统计量,如均值、方差等。
- 不同年份下的分解结果。
例如,我们可能会发现不同制造年份对应的残差分布存在差异,这可能提示制造年份在模型中具有一定的调节作用。
六、进一步分析和可视化
绘制不同制造年份残差的直方图:
hist resid if year < 1980 // 绘制制造年份小于 1980 年的残差直方图
hist resid if year >= 1980 // 绘制制造年份大于等于 1980 年的残差直方图
绘制残差关于制造年份的箱线图:
box resid, over(year)
通过这些可视化,我们可以更清晰地看到制造年份对残差分布的影响。
七、总结
含协变量的培根分解为我们提供了一种深入分析数据和模型的工具。通过上述步骤在 Stata 中的操作,我们能够更全面地理解变量之间的关系,并对模型的有效性和解释性进行评估。
在实际应用中,根据具体的研究问题和数据特点,可能需要对模型和分解方法进行适当的调整和扩展。但总体而言,掌握上述基本步骤是进行此类分析的重要基础。
希望这篇教程能够帮助您在 Stata 中顺利进行含协变量的培根分解,并为您的数据分析工作提供有价值的参考。
以下是上述代码运行的可能结果示例(实际结果会因数据的具体情况而有所不同):
. reg price weight mpg year i.cylinders
Source | SS df MS Number of obs = 74
-------------+---------------------------------- F(4, 69) = 23.48
Model | 58825772.78 4 14706443.19 Prob > F = 0.0000
Residual | 41798780.48 69 605779.7171 R-squared = 0.5857
-------------+---------------------------------- Adj R-squared = 0.5571
Total | 1.00624553e+08 73 1.37841853e+06 Root MSE = 778.27
------------------------------------------------------------------------------
price | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
weight | 4.688558 1.268542 3.697 0.000 2.193127 7.184008
mpg | -88.18224 27.21111 -3.241 0.002 -142.7485 -33.61599
year | 68.75515 27.77887 2.475 0.016 13.84587 123.6644
cylinders |
4 | -1347.081 827.8814 -1.628 0.108 -3006.745 312.5832
6 | -2187.311 507.5332 -4.314 0.000 -3199.705 -1174.918
8 | -4884.742 740.1945 -6.600 0.000 -6360.713 -3408.772
_cons | 7257.774 1723.485 4.211 0.000 3868.204 10647.34
------------------------------------------------------------------------------
. bacondecomp resid year
Bacon decomposition
--------------------------------------------------------------------------------
Variable | Mean | Std. Dev. | Min | Max |
----------+---------------+-------------------+---------------+---------------+
Residual | -1.78e-14 | 778.27237 | -2582.887 | 2271.704 |
--------------------------------------------------------------------------------
代码附录
以下是完整的代码示例:
use "auto.dta", clear
reg price weight mpg year i.cylinders
predict resid, resid
ssc install bacondecomp
bacondecomp resid year
hist resid if year < 1980
hist resid if year >= 1980
box resid, over(year)
【视频号28】含协变量的培根分解陈强老师的视频号第28期:带协变量的培根分解https://mp.weixin.qq.com/s/wiJ-CREXZsBSZNj3zM4-cw
【Stata 18 新功能】实例详解:培根分解 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/633414423