bootstrap再抽样_Bootstrap抽样(自展法)

Bootstrap又称自展法,是用小样本估计总体值的一种非参数方法,在进化和生态学研究中应用十分广泛。例如进化树分化节点的自展支持率等。

Bootstrap的思想,是生成一系列bootstrap伪样本,每个样本是初始数据有放回抽样。通过对伪样本的计算,获得统计量的分布。例如,要进行1000次bootstrap,求平均值的置信区间,可以对每个伪样本计算平均值。这样就获得了1000个平均值。对着1000个平均值的分位数进行计算, 即可获得置信区间。已经证明,在初始样本足够大的情况下,bootstrap抽样能够无偏得接近总体的分布。

下面是一个实例:

例如,假设有一批产品,随机抽出30个,使用寿命(天数)如下,试用bootstrap的方法估计这批产品寿命95%的置信区间。

dat

29,232,169,208,253,142,105,419,179,

324,287,115,132,308,356,286,221,204,

105,45,245)

图1 初始数据的频数直方图

### 查看原始数据的频数直方图

hist(dat, col = "gray")

#生成一个存储器

boot.sample 

## 循环1000次,有放回的抽样,每次生成的

## 新样本存储在boot.sample中

for(i in 1:1000){

boot.sample[[i]] 

}

## 求每个样本的mean,结果为1000个bootstrap样本的mean

boot.mean 

## 频数直方图

hist(boot.mean, col = "gray")

## 求95%的置信区间

CI95 

## 在频数直方图上加置信区间

abline(v = CI95, col = "red")

图2  Bootstrap 1000个伪样本平均值的频数直方图

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值