线性回归:
1、图1、数据(特征(工资、年龄)) 2维 所以对应y为面
2、目的(预测额度) y
3、考虑(特征的影响程度(参数))
4、假设是年龄的参数,是工资的参数 theta0为偏置项
5、拟合的平面为:
6、 为误差项服从高斯分布 高斯分布符合很多事件发生规律 同时样本间相互独立且同分布
由于服从高斯分布误差项概率密度函数为该式
误差项替换
7、利用极大似然估计对theta进行计算 实质点事让上述概率最大化 这样他就越接近于与真值 误差越小实际上概率就越大
接下来是公式推导 实际为大学概率论知识
似然函数
对数似然
对公式进行化简
最小二乘法 这里实际将问题从极大转换成了求极小 求导前变后不变
这一步实际是(Z0...Zm)(Z0...ZM)^T=累加Z^2(0-m)
最后求偏导另其为0 推出theta的估计值,x,y已知故可求.
8、线性回归能直接求解theta实际为特殊情况,其他都是需要迭代优化的.
9、评估项我们一般使用决定系数 MSE均方误差 RMSE均方根误差
10、https://www.cnblogs.com/pinard/p/6016029.html 线性回归应用案例