目录
回归分析是研究两个变量之间的不确定性关系,考察变量之间的数量变化规律,通过回归方程的形式描述和反映这种关系,帮助人们挖掘出变量之间隐藏的规律。
建立回归模型的一般过程为:
1)建立理论回归模型
2)估计模型参数
3)回归模型检验
4)模型诊断
5)利用回归方程进行预测
以下用思维导图展示回归分析的各个过程:
以下是RStudio实现过程:
1、建立模型及显著性检验
首先是载入数据,在此用的是UCI的一个数据集,包含13种汽车车型的相关指标,共398个样本。选可行驶的公里数MPG作为因变量y,排气量displace、马力horsepower、自重weigh为自变量,分别设为x1、x2、x3,各变量均为数值型。
利用car包中的scatterplotMatrix函数绘制矩阵散点图,以便观察自变量与因变量的关系,可以看到,y与各自变量之间呈现出一定的线性关系。