R语言统计分析:bootstrap方法

本文介绍了Bootstrap方法的基本原理,包括非参数和参数Bootstrap方法,并通过池塘捕鱼的例子直观解释其概念。接着,文章展示了如何使用R语言进行Bootstrap估计,以women数据集为例,计算weight变量均值的95%可信区间。文章还提到了在估计多个参数时的注意事项,如在urine数据集上构建线性模型,并讨论了重抽样次数的选择和可信区间的计算方法。最后,指出不同计算方法可能导致可信区间差异,并提供了相关参考资料。
摘要由CSDN通过智能技术生成

bootstrap方法的原理:当总体分布未知时,我们可以通过对总体进行反复的、有放回的抽样,从而组建多个样本并利用这些样本对总体进行推断,这个方法被称为非参数bootstrap方法。

当我们已经知道总体的分布函数,但其中含有待估参数时,我们也可以使用这种方法对参数进行估计,此时可以称为参数bootstrap方法。因此与上一讲提到的置换检验相比,bootstrap方法很适合来解决参数估计的问题。

网上有一个例子对bootstrap方法解释的很好。这个例子说为了测量池塘中有多少鱼,我们可以首先在池塘中放入100尾带有标记的鱼,过一段时间后当池塘中的鱼混合均匀后,我们可以进行反复的有放回的捕捞,看看每次捞出的鱼当中有多少带有标记,从而对池塘中鱼的总量进行估计。这个例子很形象的解释了bootstrap方法的原理。

接下来我们使用bootstrap方法来估计women数据集中weight变量均值的95%可信区间。

> library(boot)
> dt=women
> #Step1 构造一个函数,这个函数必须能输出重抽样的结果
> hs
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mrrunsen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值