一、一元线性回归
一元线性回归是回归分析中最简单的一种形式,主要考察单独1个自变量对因变量的影响。其模型形如: y=a+ βx+ε
一元线性回归分析的基本步骤如下:
依据变量之间的关系,判断其是否是线性关系。如果是线性关系,可以利用OLS方法或其他方法进行回归模型的参数估计,然后根据参数估计的结果进行检验。
在检验过程中,可以先对模型的解释能力进行拟合优度判定,拟合优度的判定系数如果非常小,说明建立的回归方程解释能力较差,在进行回归分析的过程中可能还有其他重要因素没有加入到模型当中,可以考虑增加有重要影响的自变量;回归方程总体显著性如果不显著,说明变量之间的线性关系不明显,不适合做线性回归;在拟合优度判定系数比较高、方程总体显著的情况下,对回归系数进行检验,通过显著性检验的回归系数才对因变量有解释能力。
只有通过检验的模型才能够充分描述变量之间的关系,建立的模型才有现实意义。
对于一元线性回归分析,也可用其他工具包,如statsmodels中的ols、sklearn.linear_model中的类LinearRegression等。
二、理论与基础
自变量:样本的特征数值
因变量:需要预测的样本的预测值
1.简单线性回归(simple linear regression)
y:样本