bootstrape自助法-matlab实现

bootstrape自助法思想

  • 有放回地全抽

有放回的抽取样本,抽取和原样本数量相同的样本

  • 抽取和原样本量不同数量的样本:
  1. 抽取和原样本量不同数量的样本
  2. 重复抽样进行B次
  3. 每次都可以求一个相应的统计量/估计量(例如方差)
  4. 统计量求均值查看稳定性(用方差表示)
    在这里插入图片描述
  • 例子:一共1000个数据,第一次抽10个数据后放回,第二次抽10个数据后放回…,重复100次,得到1000个数据,重复100次所得到的样本即是bootstrape自助法得到的样本

matlab代码

  • bootstrape调用函数:每次抽取一个样本,重复m次,可以根据自身情况进行设计和更改,比如每次抽取10个样本,重复m/10次。
function [s,t]=bootstrape(data)
% s表示bootstrape重复抽样得到的样本
% t表示的是原数据集data中未被重复抽样剩余的样本
t = data;
[m,n] = size(data);
s = zeros(m,n);
labels = [];
for i=1:m
    index = unidrnd(m);%产生从1到m所指定的最大数数之间的离散均匀随机整数    
    labels = [labels index];    
    s(i,:) = data(index,:);    
end
kind=unique(labels);
disp(length(kind))
t(kind,:) = [];
end
  • 一次抽样抽取10个样本,重复n次
 function [s,t]=bootstrape_10(data)
% s表示bootstrape重复抽样得到的样本
% t表示的是原数据集data中未被重复抽样剩余的样本
N=10;
t = data;
[m,n] = size(data);
s = [];
labels = [];
for i=1:floor(m/N)
     index = unidrnd(m,N,1);%产生从1到m所指定的最大数数之间101列的离散均匀随机整数    
    labels = [labels index];    
    s = [s;data(index,:)];    
end
kind=unique(labels);
disp(length(kind))
t(kind,:) = [];
end
  • 主函数
clear all;close all;clc;
data=xlsread('自身的原数据集(根据自身情况写).xlsx');
[s,t]=bootstrape(data);
[s1,t1]=bootstrape_10(data);
xlswrite('s.xlsx',s);
xlswrite('t.xlsx',t);
xlswrite('s1.xlsx',s1);
xlswrite('t1.xlsx',t1);

参考文献

Bootstrap(自助法) 学习笔记
自助法 matlab,matlab自助法实现

  • 1
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
自助法bootstrap)是一种基于原始数据随机抽样的统计方法,可以用于估计数据集的统计特征和模型参数的置信区间。Python可以使用numpy和pandas等库来实现自助法。 以下是一个简单的自助法实现示例: ```python import numpy as np # 原始数据集 data = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) # 自助法抽样,重复抽样10次 bootstrap_samples = [] for i in range(10): bootstrap_samples.append(np.random.choice(data, size=len(data), replace=True)) # 计算每个自助抽样样本的统计特征,例如均值和标准差 means = [] stds = [] for sample in bootstrap_samples: means.append(np.mean(sample)) stds.append(np.std(sample)) # 输出结果 print("Original data:", data) print("Bootstrap sample means:", means) print("Bootstrap sample standard deviations:", stds) ``` 在上面的代码示例,我们首先定义了一个原始数据集 `data`,然后使用 `np.random.choice` 函数进行自助抽样,得到了重复抽样的10个样本。接着,我们计算了每个样本的均值和标准差,并将它们存储在 `means` 和 `stds` 列表。最后,我们输出了原始数据集和每个自助样本的统计特征。 需要注意的是,自助法的核心思想是通过重复抽样来估计数据集的统计特征和模型参数的置信区间。因此,在实际应用,我们需要根据具体的问题和数据集来选择适当的自助样本数量,并使用统计方法对自助样本进行分析和处理。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值