问题
在现实研究当中,受限于疾病的罕见程度和财力支持,一些研究很难收集到大量的样本,这使得研究获得的连续性资料常常呈现偏态分布,如何描述资料的集中趋势和离散趋势成为了一个问题,一般常用的方法是用中位数和百分位数法进行描述,效果通常不尽如意;随着统计学的发展,如何去估算这类样本的集中趋势及相应统计量的置信区间呢?此外,研究中还需要估计一些特殊统计量如AUC等的置信区间,如何进行估算呢?
Bootstrap法
1979年,美国斯坦福大学的Bradley Efron教授在《Annals of Statistics》上发表一篇统计学方法文章,正式提出了一种称为bootstrap的方法,中文译为自助重抽样法。
该方法有几个概念:
1、自助样本:设总体的分布F未知,但已经有一个容量为n的来自分布F的数据样本,自这一样本中按放回抽样的方法抽取一个容量为n的样本,该样本称为自助样本。
2、自助法:是从原始样本中,抽取很多个自助样本,利用大量的自助样本对总体F进行统计推断的方法,抽取的次数称为B。
Bootstrap法估计参数的步骤
1、由于总体分布F未知,因此需