Stata：Bootstrap 简介

最新推荐文章于 2025-04-07 10:31:53 发布

arlionn

最新推荐文章于 2025-04-07 10:31:53 发布

阅读量3.4w

点赞数 17

分类专栏： stata编程 Bootstrap-MC 文章标签： Bootstrap

连享会 ( lianxh.cn ) 原创，转载申请：StataChina@163.com

本文链接：https://blog.csdn.net/arlionn/article/details/100777004

版权

本文介绍了Bootstrap在Stata中的应用，包括有放回抽样和标准差与标准误的概念。通过实例展示了如何使用Stata进行Bootstrap程序编写，如OLS回归的RMSE标准误和VIF的Bootstrap估计。此外，提供了相关参考文献。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

作者：吴雄(湘潭大学)，童天天(中南财经政法大学)
连享会
Source: The Bootstrap in Stata

原文链接： 连享会-Bootstrap简介

文章目录

1. Bootstrap 简介

bootstrap 是一种崭新的增广样本统计方法，为解决小样本问题提供了很好的思路。它是非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法。对于回归模型：对于线性回归模型：

$y_t = X_t β+u_t, \\ E(u_t|X_t)=0,\ E(u_s u_t=0) \ ∀\ s≠t$

可以通过多种方法来建立 bootstrap 的数据生成过程 (DGP) 。所谓的 bootstrap DGP 是对未知的「真实 DGP」的一种估计。如果 bootstrap DGP 在某种意义上接近真实的 DGP，那么由 bootstrap DGP 生成的数据将与真实 DGP 生成的数据相似(如果已知的话)。如果是这样，则进行模拟使用 bootstrap DGP 获得的 P 值与真实 P 值足够接近，可以进行准确的推理。

Bootstrap 的基本思想是：如果 观测样本 是从母体中随机抽取的，那么它将包含母体的全部的信息，那么我们不妨就把这个观测样本视为 “总体”。可以简单地概括为：既然样本是抽出来的，那我何不从样本中再抽样。

具体而言，Bootstrap 的第一步是生成一系列 bootstrap 经验样本 (Empirical Sample) (有时也被形象地称为「伪样本」)，每个样本都是初始数据的一次有放回抽样。通过对 经验样本 的计算，获得统计量的分布。例如，要进行 1000 次 bootstrap，求平均值的置信区间，可以对每个经验样本 计算平均值。这样就获得了 1000 个平均值。对这 1000 个平均值的分位数进行计算，即可获得置信区间。已经证明，在初始样本足够大且初始样本是从母体中随机抽取的情况下，bootstrap 抽样能够无偏接近总体的分布。

Bootstrap 的基本步骤如下：