写在前面:本学习基于慕课网的机器学习教程,相关的视频可以到慕课网查看。
1.线性回归
这是一个很简单很简单的一个模型,就是一个线性方程,其有斜率w1以及截距w0。当然我们也可以拟合多条这样的线,但是我们会选择那条线作为我们最终拟合的线呢?
所以问题就抛给了如何选择一条合适的线,来最能正确的拟合我们房屋的大小与价格之间的关系?
这里引入一个数学上定义线是否为最适合的选择的一个定义:残差平方和。所谓的残差平方和(RSS),就是实际我们的点到预测的线的距离,可以见下图所示:
可以看到起就是所有点到线上的差值再平方,最后将平方值求和得到的。只要RSS最小,这根线就是我们最好的拟合曲线。<