什么是最小二乘法?
第一次听到最小二乘法是在读书期间,主要是用来应付期末考试。深入了解它是在拟合曲线的过程中,有的论文对最小二乘法进行改进,增加了很多的正则项,以提高拟合度。
总的来说,最小二乘法就是最一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。实现函数的拟合。比如下图:
可以通过最小二乘法计算出函数的系数,得到a
,b
实现函数
y
=
a
+
b
x
y=a+bx
y=a+bx对这些点的误差最小。
简单的理解最小二乘法
我觉得他就是个拟合,实在不知道如何简单的讲给别人听,不过有一篇博客,讲的是够透彻。
地址是:[url](https://blog.csdn.net/ccnt_2012/article/details/81127117)
如何使用最小二乘法?
做工程,最重要的是能够利用各种工具。如何使用最小二乘法?我们假设要拟合的函数是:
y
=
s
i
n
2
π
x
y=sin2{\pi}x
y=sin2πx
首先定义出函数:
# 目标函数
def real_func(x):
return np.sin(2*np.pi*x)
# 多项式
def fit_func(p, x):
f = np.poly1d(p)
return f(x)
# 残差
def residuals_func(p, x, y):
ret = fit_func(p, x) - y
return ret
简单的生成数据,并加点噪音
# 十个点
x = np.linspace(0, 1, 10)
x_points = np.linspace(0, 1, 1000)
# 加上正态分布噪音的目标函数的值
y_ = real_func(x)
y = [np.random.normal(0, 0.1) + y1 for y1 in y_]
最小二乘法拟合,并把多项式的参数暴露出来。
def fitting(M=0):
"""
M 为 多项式的次数
"""
# 随机初始化多项式参数
p_init = np.random.rand(M + 1)
# 最小二乘法
p_lsq = leastsq(residuals_func, p_init, args=(x, y))
print('Fitting Parameters:', p_lsq[0])
# 可视化
plt.plot(x_points, real_func(x_points), label='real')
plt.plot(x_points, fit_func(p_lsq[0], x_points), label='fitted curve')
plt.plot(x, y, 'bo', label='noise')
plt.legend()
return p_lsq
结果展示:
- 二次函数
- 三次函数
- 八次函数
结论
通过图片可以看出来,多项式的次数越高,拟合的越好,但是也太高的话也会出现过拟合现象。比如说最后一图,都在噪点上。