非参数bootstrap
- 思想:原始有一个样本容量为n的样本,在这个样本中有放回抽取n个,重复这样的次数重复B次,每次得到的样本求得一个theta的估计,这样子就有B个估计值,求这B个估计值的标准差、均方差、偏差
samp=c(18.2,9.5,12,21.1,10.2)
theta=median(samp)#中位数
n=length(samp)
B=10#抽多少次
bs.samp=replicate(
B,
{bs.i=sample(samp,n,replace =TRUE)#you放回抽样
median(bs.i)}
)
sd(bs.samp)#方差
mean((bs.samp-theta)^2)#均方差
mean(bs.samp-theta1)#偏差
- 置信区间——分位数法
思想:将B个theta从小到大排序,
K1=B*(α/2) K2=B*(1-α/2)
( theta(K1) , theta(K2) )就是所得的置信区间 - 置信区间——bootstrap-t方法
这里的Xba用bootstrap的样本均值代替,S用bootstrap的样本标准差,u用原始样本的均值估计,此时近似 t 分布,记为w,w的表达式如下
那么区间如下
可得
将B个w的估计值排序,可以求得 K1=B*(α/2) K2=B*(1-α/2) ,则区间估计如下:
参数bootstrap - 思想:有一个来自F (x;beta)分布的样本,求得beta的估计值(极大似然估计),则可以得到F的估计分布,
- 对于连续的分布函数,可以像生成随机数的方法,求得x=g(F)的表达式,就可以生成B个样本来依次估计beta,然后可以对beta求置信区间,求均值,方差
- 对于离散的分布来说,可以根据估计的beta同样生成离散随机数作为样本,再可以求偏差,均方差等。