1.一元线性回归
一元线性回归研究的问题:
- 两个变量之间的线性关系及其统计显著性
- 两个变量:一个因变量,一个自变量
- 给定自变量的值,预测因变量的值
求解一元线性回归的最佳拟合直线
2.相关系数与回归系数的关系
关系推导
3.一元线性回归的前提条件
- 线性:自变量和因变量之间的关系是线性的(可使用散点图或残差图来检验)
- 残差(近似)服从均值为0的正态分布
- 数据点围绕回归直线的变化程度基本不变
- 残差围绕直线y=0的变化程度基本不变
4.一元线性回归的SciPy实现
scipy.stats.linregress(
x, y : 类数组格式的自变量、因变量,均为一维,也可以直接以k*2的二维数组格式提供
注意:该命令的参数格式是自变量x在前!
)
返回结果:
slope : 回归系数b
intercept : 常数项a
r-value : 两个变量的相关系数
p-value : 回归系数的双侧检验
stderr : 回归系数的标准误