做回归的一般步骤为:
1、确定回归方程中的解释变量和被解释变量
2、确定回归模型
通过观察散点图确定是建立线性回归模型还是非线性回归模型
3、建立回归模型
4、对回归方程进行各种检验
5、利用回归方程进行预测
下面就对线性回归模型的建立进行详细的阐述
一、获取数据
R软件里面有很内置的数据集,用data()函数可以查看到各种数据集
这里我们使用的是R软件自带的swiss数据集,这个数据集记录了瑞典1888年的生产力和其他各个社会经济指标的数据
首先对该数据集进行一个初步的了解
由运行结果可知该数据集有47行6列,每个变量都是数值型的
二、数据探索
1、数据质量分析
(1)缺失值分析:查看数据集中包含缺失值的记录数 sum(!com