R语言与回归分析学习笔记（bootstrap method）

最新推荐文章于 2024-08-08 05:13:48 发布

yujunbeta

最新推荐文章于 2024-08-08 05:13:48 发布

阅读量5.2w

点赞数 12

分类专栏： R语言数理统计计量经济学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yujunbeta/article/details/9255965

版权

本文介绍了Bootstrap方法在回归分析中的作用，它放宽了正态性假设，适用于数据分布未知、异常值多或样本量小的情况。通过R语言的Boot包中的boot()和boot.ci()函数，展示了如何计算统计量的置信区间，并通过具体例子对比了Bootstrap方法与传统方法的差异。Bootstrap方法在处理单个和多个统计量时都提供了稳健的推断，残差法也是Bootstrap的一种有效应用方式。

摘要由CSDN通过智能技术生成

Bootstrap方法在之前的博文《R语言与点估计学习笔记（EM算法与Bootstrap法）》里有提到过，简而言之，bootstrap方法就是重抽样。为什么需要bootstrap方法呢？因为bootstrap方法使得我们无需分布理论的知识也可以进行假设检验，获得置信区间。当数据来自未知分布，或者存在严重异常点，又或者样本量过小，没有参数方法解决问题时，bootstrap方法将是一个很棒的方法。

对于回归分析而言，bootstrap无疑对回归的正态性假设做了极大地放松，使得回归推断越来越好用，也更具有说服力。

从博文《R语言与点估计学习笔记（EM算法与Bootstrap法）》里可以看到，对于参数统计，特别是在已知分布的参数估计，bootstrap并没有多大的意义，它的结果和矩估计或者极大似然估计的结果并没有多大的差别（如果有差别会令人觉得很奇怪，不是吗？）

Boot包中提供了做bootstrap的两个十分好用的函数：boot（），boot.ci（）。两者的调用格式与参数说明如下：

Boot（）函数：

boot(data, statistic, R, sim ="ordinary", stype = c("i", "f", "w"),

strata= rep(1,n), L = NULL, m = 0, weights = NULL,

ran.gen = function(d, p) d, mle = NULL, simple = FALSE, ...,

parallel = c("no", "multicore", "snow"),

ncpus = getOption("boot.ncpus", 1L), cl = NULL)

参数说明：

Data：数据，可以是向量，矩阵，数据框

Statistic：统计量，如均值，中位数，回归参数，回归里的R^2等

R：调用统计量函数次数

Boot（）的返回值：

T0:从原始数据中得到的k个统计量的观测值

T:一个R*K的矩阵

Boot.ci（）函数：

boot.ci(boot.out, conf = 0.95, type = "all",

        index = 1:min(2,length(boot.out$t0)), var.t0 = NULL,

        var.t = NULL, t0 = NULL, t = NULL, L = NULL,

        h = function(t) t, hdot = function(t) rep(1,length(t)),

        hinv = function(t) t, ...)

参数说明：

Boot.out（）：boot函数的返回值

Type：返回置信区间的类型，R中提供的有"norm" ,"basic", "stud","perc", "bca"

最低0.47元/天解锁文章

关注

12
点赞
踩
139

收藏

觉得还不错? 一键收藏
10
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。