回归算法是监督学习其中之一。
线性回归算法是已知样本和样本对应的预测结果,求新的样本的预测结果。
1、先对已知样本进行适当的处理,包括去除一些缺省值,一些不正常的值等。
2、样本和结果进行了建模,如下:
其中x为样本,h为y也为样本对应的值,为系数,通过 可以很好拟合y,现在要求的就是。
后加入了非常非常关键的误差,如下:
假设求的系数为矩阵,含有很多的参数值,这是需要求解的。就是要求一个直线拟合所有的已知的样本和结果值。
其中x为样本属性,y为x对应的预测值,这两个值一直是已知了,比如x1,x2为工资和年龄,y为样本对应的银行给予的贷款值,
为误差,这个是关键突破点。
现在就是要通过x和y值求出来,使得x和y拟合最好。
3、关键点就是误差,误差