回归分析是统计学的核心问题,通常用来用一个或多个解释变量来预测相应变量,有效的回归是一个交互的、整体的、多步骤的过程,而不仅仅是一个技巧
OLS回归
为了能够恰当地解释OLS模型的系数,数据必须满足以下假设:
- 正态性,即对于固定的自变量值,因变量值呈正态分布
- 独立性,因变量值之间相互独立
- 线性, 因变量与自变量之间线性相关
- 同方差性,因变量的方差不随自变量的水平不同而变化
如果违背上述假设,统计检验结果或所得的置信区间很可能就不精确了
简单线性回归
- 数据准备
提取鸢尾花数据中的山鸢尾数据作为本次回归数据源,该数据前文已经介绍,可参考鸢