自助法和蒙特卡罗

##蒙特卡罗仿真:用发射随机数的方法模拟数据,根据模拟1000次之后得到的结果预测,由于随机数是正态分布的,要用mvrnorm方法模拟随机数。
##勾MASS package
alpha=c()
for(i in 1:1000)
{
mu1=c(0,0)
sigma1=matrix(c(1,0.5,0.5,1.25),nrow=2) ###σ²x=1, σ²y=1.25, and σxy=0.5
rand1=mvrnorm(n=100,mu=mu1,Sigma=sigma1) ##sigma是上面拼成的矩阵
X= rand1[,1]
Y= rand1[,2]
alpha[i]=(var(Y)-cov(X,Y))/(var(X)+var(Y)-2*cov(X,Y))
}
mean(alpha)
var(alpha)
sqrt(var(alpha)) #SE standerror

##自助抽样法 bootstrap
Hw: P200.2
Alpha=c()
mu1=c(0,0) #均值是0
sigma1=matrix(c(1,0.5,0.5,1.25),nrow=2)
rand1=mvrnorm(n=100,mu=mu1,Sigma=sigma1)
X= rand1[,1]
Y= rand1[,2]

for(j in 1:1000)
{
ran=rand1[sample(c(1:100),100,replace=TRUE),]
##above指,随机抽rand1中序号是1到100的数组,有放回100次
X=ran[,1]
Y=ran[,2]
Alpha[j] =(var(Y)-cov(X,Y))/(var(X)+var(Y)-2*cov(X,Y))
}
mean(Alpha)

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Sklearn自助是一种在机器学习中常用的非参数统计方,用于解决样本不平衡和过拟合问题。它的全称是Bootstrap,是基于自助采样(bootstrap sampling)的一种技术。 在使用Sklearn自助时,我们首先从原始数据集中进行有放回地随机抽样,形成一个与原始数据集大小相同的新数据集,该数据集称为自助样本(bootstrap sample)。由于是有放回地抽样,因此原始数据集中的一些样本可能被多次抽到,而一些样本可能没有被抽到。 通过重复这个自助采样的过程,我们可以得到多个不同的自助样本。然后,我们可以针对每个自助样本训练一个模型,并得到对应的预测结果。最后,我们可以通过对这些预测结果进行聚合,例如取平均值或投票等方式,来得到最终的预测结果。 Sklearn中的BaggingRegressor和BaggingClassifier就是使用了自助的集成学习方。它们通过并行地训练多个基模型,并使用自助来生成不同的训练数据集,以提高模型的稳定性和泛化能力。 使用Sklearn自助可以有效地减小模型的方差,并且能够应对样本不平衡和过拟合等问题。然而,自助也会引入一定的偏差,因为一些样本可能在自助样本中被多次抽到,而另一些样本则没有被抽到。 总的来说,Sklearn自助是一种强大的工具,可以用于改善模型的性能,特别是在处理样本不平衡和过拟合问题时。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值