1.
2.
3.
spark提供的回归算法:
线性回归算法概述:
线性回归算法原理
最小二乘法
求的是偏导,等于0 是为了使误差最小,所谓的二乘就是误差平方和
随机梯度下降(应用方便比较广)
用于求预测值
这是代价函数, 随机在于随机取n的数,没有都选,这样节省时间,1/2代表调节性的系数,用处不大,h(x^(i))代表预测值,y^(i)代表实际值
这里对其求偏导,显示一种陡峭函数
代表梯度下降的步长,这个参数必须设置合理,太大会导致无法收敛,太小会试模型收敛过慢,左边的结果值是反复更新迭代的值
最终计算样式图类似这个: