rstudio线性回归_R语言基础入门之五:简单线性回归

本文介绍了如何在R语言中使用RStudio进行简单线性回归分析。通过内置的trees数据集,展示了建立线性回归模型、模型诊断、变量变换以及模型预测的过程。在模型诊断中,针对高影响力的样本进行了变量开方变换,以改善回归结果。此外,还提及了多元回归和变量筛选的方法。
摘要由CSDN通过智能技术生成

线性回归可能是数据分析中最为常用的工具了,如果你认为手上的数据存在着线性定量关系,不妨先画个散点图观察一下,然后用线性回归加以分析。下面简单介绍一下如何在R中进行线性回归。

一、回归建模

我们利用R语言中内置的trees数据,其中包含了Volume(体积)、Girth(树围)、Height(树高)这三个变量,我们希望以体积为因变量,树围为自变量进行线性回归。 plot(Volume~Girth,data=trees,pch=16,col='red')

model=lm(Volume~Girth,data=trees)

abline(model,lty=2)

summary(model)

首先绘制了两变量的散点图,然后用lm函数建立线性回归模型,并将回归直线加在原图上,最后用summary将模型结果进行了展示,从变量P值和F统计量可得回归模型是显著的。但截距项不应该为负数,所以也可以用下面方法将截距强制为0。 model2=lm(Volume~Girth-1,data=trees)

二、模型诊断

在模型建立后会利用各种方式来检验模型的正确性,对残差进行分析是常见的方法,下面我们来生成四种用于模型诊断的图形。 par(mfrow=c(2,2))

plot(model)

par(mfrow=c(1,1))

这里左上图是残差对拟合值作图,整体呈现出一种先下降后下升的模式,显示残差中可能还存在未提炼出来的影响因素。右上图残差QQ图,用以观察残差是否符合正态分布。左下图是标准化残差对拟合值,用于判

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值