R语言使用regsubsets等函数进行回归模型的选择

最新推荐文章于 2024-07-30 08:31:50 发布

ZY_Jack

最新推荐文章于 2024-07-30 08:31:50 发布

阅读量2w

点赞数 14

分类专栏： R语言实战文章标签： r语言

本文链接：https://blog.csdn.net/ZY_Jack/article/details/106072609

版权

两模型比较：

anova（）函数：可以比较两个嵌套模型的拟合优度。

fit1<-lm(Murder~Population+Illiteracy+Income+Frost,data=states)
fit2<-lm(Murder~Population+Illiteracy,data=states)
anova(fit2,fit1)

结论：p=0.994，不显著，不需要将Income和Frost添加到线性模型中。

AIC（）函数：考虑了模型的统计拟合度遗迹用来拟合的参数数目。

fit1<-lm(Murder~Population+Illiteracy+Income+Frost,data=states)
fit2<-lm(Murder~Population+Illiteracy,data=states)
AIC(fit2,fit1)

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ZY_Jack

关注关注

14
点赞
踩
81

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

R语言leaps包中的regsubsets函数实现全集子集回归(all subsets regression)、使用调整R方和Mallows Cp统计量筛选最优模型、并可视化不同组合参数下的模型指标

data+scenario+science+insight

01-20

4848

R语言使用leaps包中的regsubsets函数实现全集子集回归（All Subsets Regression，ASR）、使用调整R方和Mallows Cp统计量筛选最佳模型、并可视化不同组合参数下的模型指标、使用leaps包的plot函数和car包的subsets函数可视化不同组合下的最佳模型

使用R语言构建逐步回归模型

DevGOOD的博客

08-25

688

逐步回归是一种逐步选择变量的方法，用于构建统计模型。在R语言中，我们可以使用逐步回归函数来执行这个过程。这些工具使我们能够有效地选择最佳的预测变量组合，以构建高效的统计模型。该函数基于最小二乘法，通过计算拟合准则（如AIC、BIC）来选择最佳的模型。函数来查看逐步回归的结果，包括每个模型的拟合准则、选择的变量以及相应的系数。上述代码将生成一个拟合准则随自变量个数变化的图表，帮助我们选择最佳的模型。它们基于不同的准则来进行变量选择，并提供更多的灵活性。函数类似，只是它们使用不同的准则来选择模型。

1 条评论您还未登录，请先登录后发表或查看评论

使用子集回归的方程选择： regsubsets：查找将测量数据与结果相关联的多元线性回归方程。见 regtest.html-matlab开发

05-29

回归采用数据列 A（自变量）的矩阵，并使用这些列的线性组合预测因值的向量 b。 A 的每一行都可以是测试测量值，而 b 的相应元素是测试结果。因此回归方程根据测量值预测测试结果。 A 中的一列提供了回归方程中的常数项。形式上，我们计算 x 以使平方误差总和 Ax-b 最小化。较小的平方和意味着 Ax 是 b 的良好预测器。反斜杠运算符 \（如 x=A\b）或函数 linfit ([x,xse]=linfit(A,b)) 在简单情况下提供了解决方案。通常会记录许多不同的因变量，并且不知道哪个提供了最好的回归预测。选择最佳预测方程并不容易，并且已经提出了各种方法（例如回归中的子集选择、AJ Miller、模型选择、H Linhart 和 W Zucchini）。这里演示的函数调查自变量的所有可能子集，直到给定大小。从这些子集方程中选择最好的方程，其中可能有几个。初步调查可

回归模型选择(R语言版)

CauchyIsNotYou的博客

10-24

4541

回归模型选择(R语言版) 选择准测: With Cp , AIC and BIC, smaller values are better, but for adjusted R2 , larger values are better. Model choice should be guided by economic theory and practical considerations, as well as by model selection criteria. 案例 Illustrate mod

r语言 fread函数参数怎么选择_子集选择&如何选择最优模型（R语言）

weixin_39810856的博客

11-22

938

1. 最优子集选择若有p个解释变量，则存在2^p个可用于建模的变量子集，根据RSS和R方的改善情况选择最简单的模型。 2. 逐步选择（向前、向后）只需拟合p(p+1)/2个模型，运算效率极大提高，但得到的模型可能非最优模型。通常将向前向后逐步选择结合使用，在加入新变量的同时剔除不能提升模型拟合效果的变量。基于测试误差选择最优模型：1） Cp值、AIC、BIC、调整R方，间接估计测试误差2）验证集...

R语言使用leaps包中的regsubsets函数实现全集子集回归、使用调整R方和Mallows Cp统计量筛选最佳模型、并可视化不同组合参数下的模型指标

最新发布

statistics+insight+vista+power

07-30

279

R语言survival包clogit函数构建条件logistic回归模型、使用AIC函数查看条件logistic回归模型的AIC值（也可以比较简单模型和复杂模型的AIC）

statistics+insight+vista+power

06-22

1030

R语言survival包clogit函数构建条件logistic回归模型、使用AIC函数查看条件logistic回归模型的AIC值（也可以比较简单模型和复杂模型的AIC）

python回归模型如何筛选变量_如何进行变量筛选和特征选择(二)？最优子集回归...

weixin_39762348的博客

02-03

3668

01 模型简介最优子集回归是多元线性回归方程的自变量选择的一类方法。从全部自变量所有可能的自变量组合的子集回归方程中挑选最优者。如m个自变量会拟合2m-1个子集回归方程,然后用回归方程的统计量作准则(如交叉验证误差、Cp、BIC、调整R2等指标)从中挑选。采用的R包是leaps，函数是regsubsets()。结合一个线性回归的例子，和大家分享一下如何运用R软件实现最优子集回归。02 加载数据...

R语言和医学统计学（7）：多元线性回归

医学和生信笔记的博客

10-29

2539

这是R语言和医学统计学的第7篇内容。主要是用R语言复现课本中的例子。我使用的课本是孙振球主编的《医学统计学》第4版。

R语言实验汇总----助力高绩点

zhiyeegao的博客

03-16

8021

多元统计分析及R语言建模（第四版）实验一：实验1：用R语言求矩阵的逆矩阵、特征根和特征向量 P37 练习题二-1 r=c(1.00,0.80,0.26,0.67,0.34,0.80,1.00,0.33,0.59,0.34,0.26,0.33,1.00,0.37,0.21,0.67,0.59,0.37,1.00,0.35,0.34,0.34,0.21,0.35,1.00) r R...

R语言实战笔记后续修改

WSQ981222的博客

06-16

489

#2021/6/7 R语言复习检索 #数组 package23 myarry<-array(vector,dimensions,dimnames) #列如 z<-array(1:24,c(2,3,4),dimnames = list(dim1,dim2,dim30))#中间的dimension中的2表示行数，3表示列数，4表示数组中矩阵的个数 #数据框 package24 #table表示连列表 patientid<-c(1,2,3,4) admdata<-c("10/15/2..

用R中的包实现逐步回归

gaomeihong1993的博客

06-29

7014

逐步回归逐步回归三种策略计算逐步回归MASS包的stepAIC()方法leaps包的regsubsets()方法caret包的train()方法逐步回归三种策略 1.前向选择从模型中没有预测变量开始，迭代地添加最多的贡献预测变量，并在改进不再具有统计显着性时停止。 2.向后选择（或向后消除），从模型中的所有预测变量（完整模型）开始，迭代地移除最少的贡献预测变量，并在您拥有所有预测变量具有统计显着性的模型时停止。 3.逐步选择（或顺序替换），这是前向和后向选择的组合。从没有预测变量开始，然后依次添加最有

R语言【MASS】——step AIC()：在逐步算法中采用AIC选择模型

whitedrogen的博客

02-28

1360

Arguments 参数【object】：表示适当类的模型的对象。这被用作逐步搜索中的初始模型。参数【scope】：定义在逐步搜索中检查的模型的范围。这应该是一个单独的公式，或者一个包含上下组件的列表，两个公式。请参阅如何指定公式以及如何使用公式的详细信息。参数【scale】：定义中用于选择模型的AIC统计量，目前仅用于lm和aov模型。参数【direction】：逐步搜索的模式，可以是“both”、“backward”或“forward”，默认为“both”。如果scope参数缺失，默认的方向是"bac

生存分析 R语言（五）——Cox PHM(4) 协变量选择

cigarrrr的博客

11-24

2224

协变量选择 Stepwise approach 这里只介绍基于AIC的stepwise方法，还有基于p值的方法，太繁琐了，还不如用AIC，所以不做赘述。 library(survival) library(MASS) #stepAIC函数在该包中 Rossi=read.table(choose.files(),header=TRUE) #rossi是txt文件，header识别第一行为变量 attach(Rossi) S=Surv(week,arrest) Scope=list(upper=~fin+age

R 多元线性回归

王文强的博客

11-24

984

install.packages("Hmisc") install.packages("mice") library(Hmisc) library(mice) data_1<-impute(ma317projectdata_2$X2012SP.DYN.LE00.IN,mean) #对结果进行填充 ma317projectdata_2$X2012SP.DYN.LE00.IN[is.na(ma...

R语言学习之数据分析实战(一)

weixin_44211964的博客

09-20

8743

R语言学习之数据分析实战(一) 一、线性回归回归（regression）：通常指那些用一个或多个预测变量，也称自变量或解释变量，来预测响应变量，也称为因变量、效标变量或结果变量的方法。普通最小二乘回归法（OLS）以women数据集为例： lm()函数 formula：需要拟合的形式，y~x data：需要使用的数据集，数据框的形式 R表达式中常用的符号使用lm()函数对women数据集进行回归分析 > fit <- lm(weight ~ height, data=wome

R语言实战读书笔记(八)回归

ddem35827的博客

11-29

811

简单线性：用一个量化验的解释变量预测一个量化的响应变量多项式：用一个量化的解决变量预测一个量化的响应变量，模型的关系是n阶多项式多元线性：用两个或多个量化的解释变量预测一个量化的响应变量多变量：用一个或多个解释变量预测多个响应变量 Logistic：用一个或多个解释变量预测一个类别型响应变量泊松：用一个或多个解释变量预测一个代表频数的响应变量 Cox比例风险：用一个或...

R语言回归篇

R语言 使用regsubsets等函数进行回归模型的选择

两模型比较：

R语言使用regsubsets等函数进行回归模型的选择