在学习线性回归中,接触了到最小二乘法,知道怎么用它来解决回归问题,但其本质还没深入地理解,然后在项目中也听到了这个知识点,所以就有了这篇笔记。
最小二乘法的核心就是使得所有数据的偏差平方和最小。但是在数据拟合的时候,为什么是要使得用模型预测出来的值和真实值之差的平方和最小?
这个问题见链接(http://blog.sciencenet.cn/blog-430956-621997.html)。里面的假设是:所有偏离f(x)的点都是有噪音的。一个点偏离越远说明噪音越大,这个点出现的概率也越小。那么偏离程度x与出现概率f(x)满足什么关系呢?——正态分布。
已知N个点(用D来表示),求直线(用h来表示)出现的概率就可以表示为:P(h|D).(P(h|D)表示在D的情况下,h发生的概率)。