1.算法简介
线性回归模型实际上是基于目标变量与特征变量之间线性相关的假设前提,对研究对象的d个特征变量进行线性组合,从而预测目标变量取值的函数。
设定研究对象的d个特征变量(即属性)为:,其中 是 在第个属性上的取值。线性回归模型的基本表达形式为:
写成向量形式:
其中。
2.算法原理
训练线性回归模型的目的就是确定的取值,使样例 的预测值 与真实值 的偏差尽可能小。换句话说,线性回归模型参数求解的过程,实质上是寻求一条完美直线穿过所有的训练集数据点,使所有数据点到该直线的距离最小,这里的距离通常是指