Bootstrap重抽样方法

最新推荐文章于 2024-07-07 02:58:35 发布

ofoliao

最新推荐文章于 2024-07-07 02:58:35 发布

阅读量1.1w

点赞数 5

分类专栏： Stat 文章标签： Bootstrap 重抽样参数化非参数半参数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ofoliao/article/details/103000457

版权

Stat 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Bootstrap重抽样方法

Bootstrap重抽样数据集的产生方式主要分为3种方法：

非参数重抽样 Non-parametric resampling

此方法不假设数据的分布或模型。数据表示为n个独立观测向量 $y_{obs}$ , 假设求参数 $\hat{\theta}(y_{obs})$ 的置信区间，非参数bootstrap抽样的步骤如下：

从 $y_{obs}$ 中进行放回的重抽样 $n$ 次，得到bootstrap数据集，表示为 $Y^*$ ；
计算抽样数据集的统计量： $\hat{\theta}^* = \hat{\theta}(Y^*)$
重复步骤1,2总共 $B$ 次，得到 $\hat{\theta}^*$ 的bootstrap分布。

从排序后的系列 $\hat{\theta}_1^*,\hat{\theta}_2^*,\ldots,\hat{\theta}_B^*$ ，可以计算 $\hat{\theta}^*$ 的置信区间。

参数重抽样 Parametric resampling

根据数据计算总体 $\theta$ 的估计值 $\hat{\theta}$ ，方式比如采用极大似然估计；
把估计值 $\hat{\theta}$ 代入模型 $F_Y(.;\hat{\theta})$ ; 从模型抽取 $n$ 个观测，形成数据集 $Y^*$ ;
计算 $\hat{\theta}^* = \hat{\theta}(Y^*)$ ；
重复2,3步 $B$ 次，得到估计量的参数bootstrap分布。

参数重抽样和非参数重抽样的主要区别在于bootstrap数据集 $Y^*$ 的生成，如果是从原始数据生成的，是非参数重抽样；如果是原始数据计算估计参数，然后把估计参数代入模型或分布，再生成数据集的，是参数重抽样。

半参数重抽样 Semi-parametric resampling

半参数重抽样是指模型 $y=g(\beta,x)+r$ $r$ 是残差。

令 $\tilde{r}_i=r_i - \bar{r}$ ，采用非参数方式重抽样方式得到 $r_1^*, r_2^*, \ldots, r_n^*$
计算bootstrap数据集(参数方法) $y_i^*=g(\hat{\beta}, x) + r_i^*, \quad i\in 1,2,3,\ldots,n$ ，得到 $Y^*$ ；
根据生成的数据集 $Y^*$ , 计算 $\beta^*$
重复步骤1-3 $B$ 次，得到 $\beta^*$ 的bootstrap分布。

和参数重抽样相比，参数重抽样模型随机的数据来自正态分布 $\sigma^2)$ ，半参数重抽样模型随机的数据来自残差（调整）非参数重抽样。

关注

5
点赞
踩
32

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

目录

分类专栏

Stat 6篇
Python 1篇
IT 2篇
笔记 1篇
R 40篇
SAS 3篇

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。