最小二乘法是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。
最小二乘法,所谓“二乘”就是平方的意思,所以又称最小平方法。
这种是专业定义,不容易使初学者理解,接下来我用一个具体的例子来说明,让我们更加容易理解最小二乘法:
例:小明是跑运输的,跑1公里需要6块,跑2公里需要5块(那段时间刚好油价跌了),跑3公里需要7块,跑4公里需要10块,请问跑5公里需要多少块?
运用初中数学基础,我们会运用线性方程组来做,假设
将数据带入,得方程组为:
如果存在这样的
但是,这样的
形象地说,就是你找不到一条直线,穿过所有的点,因为他们不在一条直线上。如下图:
![46e43c8f3262dada01a3a7426738178c.png](https://img-blog.csdnimg.cn/img_convert/46e43c8f3262dada01a3a7426738178c.png)
可是现实生活中,我们就希望能找到一条直线,虽然不能满足所有条件,但能近似地表示这个趋势,或者说,能近似地知道5公里的运输成本,这也是有意义的
最小二乘法就是要尽全力让这条直线最接近这些点,就是使这条直线在所有数据点中间穿过,让这些点到这条直线的误差之和越小越好。这里我们用方差来算。也就是说,把每个点到直线的误差平方加起来:
当
那,如何让
解方程得:
所以,直线为
这个就是我们要的直线,虽然不能把那些点穿起来,但是它最能接近这些点。
虽然不是很完美,但是接近实际情况