Bootstrap理论的数学描述
Bootstrap方法可以通过重复抽样,获得一定规模的样本量,进而得到统计量的经验分布并进行区间估计。Bootstrap理论是一种新的增广样本统计方法,它的无先验性,以及计算过程中只需要有限的观测数据,使其可方便地应用于小样本数据处理。
Bootstrap 方法的实质就是再抽样过程,通过对观测数据的重新抽样产生再生样本来模拟总体分布。计算R(X,F)分布特征的基本步骤如下:
基于Bootstrap的质量控制图分析
步骤:
(1)对原始数据重复抽样,得到一定数量的子样本;
(2)对每个子样本计算相关的统计量;
(3)将子样本的统计量按从小到大排序,得到Bootstrap经验分布;
(4)根据控制图的控制限要求,上下限取Bootstrap经验分布的相应分位数,构建样本统计量控制图。
在具体实施中,需要考虑原始观测样本的样本量以及抽样次数。要保证应用Bootstrap方法进行估计的有效性,至少要有8个观察值。相关文献中提出根据实际情况,观测样本越多越好;Efron和Tibshirani研究提出重复抽样次数一般取1000~3000。