模型拟合一般来说有这么三种:切比雪夫近似准则
极小化绝对偏差之和
最小二乘准则
这几个原则各有各的适用范围。其中最小二乘准则是比较容易计算的。接下来我将简要的介绍最小二乘准则以及举例说明如何用python实现。
最小二乘准则
定义:给定某种函数类型
和
个数据点
,对整个数据点的极小化绝对偏差
,极小化和数为
。
拟合直线
如果我们要拟合的是直线,即
,计算过程如下:
拟合幂函数
可化为线性拟合的非线性拟合
用python求解
我们发现如果要自己计算的话,要用到偏导数,无穷级数的知识。如果数据点很多的话,函数比较复杂的,计算是十分困难的,甚至是不可能的。于是想到可以使用计算机求解。
通用代码如下:
# -*- coding: utf-8 -*-
import numpy as np
from scipy.optimize import leastsq
import pylab as pl
def func(x, p):
"""数据拟合所用的函数: A*sin(2*pi*k*x + theta)"""
A, k, theta = p
return A*np.sin(2*np.pi*k*x+theta)
def residuals(p, y, x):
"""实验数据x, y和拟合函数之间的差,p为拟合需要找到的系数"""
return y - func(x, p)
x = np.linspace(0, -2*np.pi, 100)
A, k, theta = 10, 0.34, np.pi/6 # 真实数据的函数参数
y0 = func(x, [A, k, theta]) # 真实数据
y1 = y0 + 2 * np.random.randn(len(x)) # 加入噪声之后的实验数据
p0 = [7, 0.2, 0] # 第一次猜测的函数拟合参数
# 调用leastsq进行数据拟合
# residuals为计算误差的函数
# p0为拟合参数的初始值
# args为需要拟合的实验数据
plsq = leastsq(residuals, p0, args=(y1, x))
print u"真实参数:", [A, k, theta]
print u"拟合参数", plsq[0] # 实验数据拟合后的参数
pl.plot(x, y0, label=u"真实数据")
pl.plot(x, y1, label=u"带噪声的实验数据")
pl.plot(x, func(x, plsq[0]), label=u"拟合数据")
pl.legend()
pl.show()
举例
接着我用我的一篇文章中车辆停止举例为例进行拟合,相关数据在该文章里。相信未来:从简单数学建模开始:05如何进行数学建模——以车辆停止距离模型为例zhuanlan.zhihu.com
子模型一:反应距离模型
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.optimize import leastsq
%pylab inline
plt.rcParams['font.sans-serif']=['simhei']
plt.rcParams['axes.unicode_minus']=False
dr = np.array([22,28,33,39,44,50,55,61,66,72,77,83,88])
v = np.array([20., 25., 30., 35., 40., 45., 50., 55., 60., 65., 70., 75., 80.])
db = np.array([20,28,40.5,52.5,72,92.5,118,148.5,182,220.5,266,318,376])
d = np.array([42,56,73.5,91.5,116,142.5,173,209.5,248,292.5,343,401,464])
x = v
y = dr
def func(p):
k = p
return y - k*x
r = leastsq(func,[np.sum(dr)/np.sum(v)])
k = r[0]
print('k=',k)
plt.scatter(x,k*x,label = '拟合解')
plt.plot(x,k*x)
plt.scatter(x,y,label='观测解')
plt.plot(x,y)
plt.xlabel('dr')
plt.ylabel('v')
plt.title('最小二乘法则应用')
plt.legend()
plt.show()
这是拟合后的结果,k = 1.1040,之前的结果为k = 1.1016
子模型二:刹车距离模型
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.optimize import leastsq
%pylab inline
plt.rcParams['font.sans-serif']=['simhei']
plt.rcParams['axes.unicode_minus']=False
dr = np.array([22,28,33,39,44,50,55,61,66,72,77,83,88])
v = np.array([20., 25., 30., 35., 40., 45., 50., 55., 60., 65., 70., 75., 80.])
db = np.array([20,28,40.5,52.5,72,92.5,118,148.5,182,220.5,266,318,376])
d = np.array([42,56,73.5,91.5,116,142.5,173,209.5,248,292.5,343,401,464])
x = v**2
y = db
def func(p):
k = p
return y - k*x
r = leastsq(func,[np.sum(db)/np.sum(v**2)])
k = r[0]
print('k=',k)
plt.scatter(x,k*x,label = '拟合解')
plt.plot(x,k*x)
plt.scatter(x,y,label='观测解')
plt.plot(x,y)
plt.xlabel('dr')
plt.ylabel('v')
plt.title('最小二乘法则应用')
plt.legend()
plt.show()
这张图拟合前和拟合后的差距还是挺大的。