数据集下载地址:https://pan.baidu.com/s/1HaBVhEmSaBKBfZVRMww56Q 密码:qlge
线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
本篇讨论的是关于一元线性回归,其基本形式为:Y=a * X + b。需要做到的是拟合训练集数据找出合适的参数a , b,确定方程式,用于预测未知的样本。
图像大致如下:
目标是找出拟合效果最好参数a , b,该如何确定呢?
最常见的方法是利用欧式距离。将数据视作一个个的点,进行计算,计算方法如下:
过程体现如下: