bootstrap方法的原理:当总体分布未知时,我们可以通过对总体进行反复的、有放回的抽样,从而组建多个样本并利用这些样本对总体进行推断,这个方法被称为非参数bootstrap方法。
当我们已经知道总体的分布函数,但其中含有待估参数时,我们也可以使用这种方法对参数进行估计,此时可以称为参数bootstrap方法。因此与上一讲提到的置换检验相比,bootstrap方法很适合来解决参数估计的问题。
网上有一个例子对bootstrap方法解释的很好。这个例子说为了测量池塘中有多少鱼,我们可以首先在池塘中放入100尾带有标记的鱼,过一段时间后当池塘中的鱼混合均匀后,我们可以进行反复的有放回的捕捞,看看每次捞出的鱼当中有多少带有标记,从而对池塘中鱼的总量进行估计。这个例子很形象的解释了bootstrap方法的原理。
接下来我们使用bootstrap方法来估计women数据集中weight变量均值的95%可信区间。
> library(boot)
> dt