近年来,许多数理统计方法被引入到医学研究中,有些理论在大样本的条件下才能获得稳定的解,如项目反应理论、线性状态空间模型等。但是在实际中.由于成本或者现场条件的限制而无法获得大样本。在现有样本代表性好的条件下,可以通过Bootstrap再抽样方法扩大样本量.即在传统的数理统计基础上进行统计模拟。随着计算机技术的迅猛发展,这一技术已经渗透到许多科学领域.解决了无法采集到大样本的难题。目前医学中常用的统计软件还没有提供直接产生Bootstrap样本的程序。本文提供了这一方法的SAS程序.简短、通用,可以方便医学统计工作者的使用。
Bootstrap再抽样方法简介
Bootstrap方法是一种计算机模拟方法,它处理的是实际中可能发生的,但需要大样本来求出的统计量。一般的统计推断都是基于一个分布,诸如正态分布,但数据分布未知时,或者存在异常值,样本量太小的时候,统计推断的结果可信度不高,这时候用bootstrap方法将是一个很不错的选择。令X = { x1, x2,x3, x4,…,xn},为一次实际收集的样本, xi(i=1,2,… ,n)是独立同分布的随机变量服从分布F(诸如收集了n个病人的年龄X服从正态分布)。M为分布F 的一个未知数字特征,例如M为X的均值。根据经典数理统计理论,要获取M的估计的经验分布(一个样本数据只能得到一个均值,如果想知道均值的95%CI,j就需要知道均值的分布)。就需要多次重复抽样和大样本。在小样本条件下,应用Bomtmp方法对x进行模拟重抽样。就能够在某种意义上获取M的经验分布并确定其置信区间。