scipy.optimize.curve_fit 拟合函数

赵孝正

已于 2024-01-11 16:58:25 修改

阅读量2.7k

点赞数 1

分类专栏： # scipy 文章标签： python scipy curve_fit

于 2022-08-31 14:04:58 首次发布

本文链接：https://blog.csdn.net/weixin_46713695/article/details/126622749

版权

scipy 专栏收录该内容

5 篇文章 2 订阅

订阅专栏

函数介绍

scipy.optimize.curve_fit 是 Python 的 SciPy 库中的一个函数，用于对数据进行曲线拟合。这个函数非常适合用于数据科学和工程领域中的模型拟合问题。下面是对 curve_fit 函数的一些基本介绍：

功能

curve_fit 函数的主要功能是找到最佳的参数值，使得一个模型函数最好地拟合给定的数据。换句话说，它可以用来确定在某个数学模型下，哪些参数值能最好地描述你的数据。

参数

f: 需要拟合的模型函数。这个函数应该接受自变量和所有待拟合参数作为输入，并返回模型的预测值。
xdata: 数据的自变量。
ydata: 数据的因变量，即你想要模型去拟合的数据。
p0: (可选) 参数的初始猜测值。这对于开始优化过程很有帮助，特别是当有多个局部最优解时。
bounds: (可选) 参数的边界，用于限制参数值的范围。
其他一些参数可以用来控制优化过程的细节，比如最大迭代次数、公差等。

返回值

popt: 最佳拟合参数的数组。
pcov: 参数的协方差矩阵，可以用来估计参数的不确定性。

使用示例

假设你有一组数据和一个模型函数 func(x, a, b)，你想要找到参数 a 和 b 的值，使得 func(x, a, b) 最好地拟合你的数据。你可以这样使用 curve_fit：

from scipy.optimize import curve_fit

# 定义模型函数
def func(x, a, b):
    return a * x + b

# 数据
xdata = np.array([1, 2, 3, 4, 5])
ydata = np.array([2, 3.9, 5.9, 8.1, 10.1])

# 执行曲线拟合
popt, pcov = curve_fit(func, xdata, ydata)

# popt 中包含了最佳拟合参数 a 和 b

注意事项

确保你的模型函数和数据是适当的。如果模型函数不能很好地描述数据的关系，拟合结果可能不准确。
在某些情况下，拟合过程可能不会收敛，特别是当初始猜测值离真实值很远或者数据质量不高时。
参数的协方差矩阵（pcov）可以提供关于参数不确定性的重要信息，但需要谨慎解读。

总之，scipy.optimize.curve_fit 是一个强大的工具，用于在科学和工程领域中进行数据分析和模型拟合。它的有效使用需要一定的数学和编程基础知识。

参数介绍

params:

f ：方程式
- 模型函数，f(x, …). 它必须拿一个独立的变量作为第一个参数，并将参数作为单独的剩余参数去拟合。
xdata：自变量数据，测量数据的自变量。对于具有 k 个预测变量的函数，通常应该是 M 长度序列或 (k,M) 形数组，但实际上可以是任何对象。。
ydata：因变量，相关数据，一个长度为 M 的数组 - 名义上是 f(xdata, …)。。
p0：参数的初始猜测（长度 N），如果为None，则初始值为1（如果可以使用自省来确定函数的参数数量，否则会引发 ValueError）。
bounds： array_like 的 2 元组，可选。
- 参数的下限和上限。默认为无边界。元组的每个元素必须是长度等于参数数量的数组，或者是标量（在这种情况下，所有参数的边界都相同）。
sigma：None 或者长度为 M 的序列，或者 M $\times$ M 的数组，是可选的
- 确定 ydata 中的不确定性。如果我们将残差定义为 r = ydata - f(xdata, *popt)，那么 sigma 的解释取决于它的维数：
  - 一维 sigma 应包含 ydata 中误差的标准差值。在这种情况下，优化的函数是 chisq = sum((r / sigma) ** 2)。
  - 二维 sigma 应包含 ydata 中误差的协方差矩阵。在这种情况下，优化后的函数是 chisq = r.T @ inv(sigma) @ r。
absolute_sigma
check_finite
bounds
method
jac
full_output
**kwargs

Returns

popt
pcov
infodict
mesg
ier

Example

import matplotlib.pyplot as plt
from scipy.optimize import curve_fit

def func(x, a, b, c):
    return a * np.exp(-b * x) + c

xdata = np.linspace(0, 4, 50)
y = func(xdata, 2.5, 1.3, 0.5)
rng = np.random.default_rng()
y_noise = 0.2 * rng.normal(size=xdata.size)
ydata = y + y_noise
plt.plot(xdata, ydata, 'b-', label='data')

popt, pcov = curve_fit(func, xdata, ydata)
popt

array([2.56274217, 1.37268521, 0.47427475])

plt.plot(xdata, func(xdata, *popt), 'r-',
         label='fit: a=%5.3f, b=%5.3f, c=%5.3f' % tuple(popt))

popt, pcov = curve_fit(func, xdata, ydata, bounds=(0, [3., 1., 0.5]))
popt

array([2.43736712, 1. , 0.34463856])

plt.plot(xdata, func(xdata, *popt), 'g--',
         label='fit: a=%5.3f, b=%5.3f, c=%5.3f' % tuple(popt))

plt.xlabel('x')
plt.ylabel('y')
plt.legend()
plt.show()

在这里插入图片描述

Example2

from scipy.optimize import curve_fit
import matplotlib.pyplot as plt
import numpy as np
import matplotlib
matplotlib.use('TkAgg')
matplotlib.rc("font", family='KaiTi')  # 解决汉字不显示问题


def fund(x, a, b, c):
    return a*np.sin(2*np.pi/12*x+b)+c


x = np.arange(1, 13)
x2 = np.arange(1, 13, 0.1)
y = [17, 19, 21, 28, 33, 38, 37, 37, 31, 23, 19, 18]
fig, ax = plt.subplots()
popt, pcov = curve_fit(fund, x, y)
# popt数组中，三个值分别是待求参数a,b,c
ax.plot(x, y, 'b-', label='original values')
# ax.legend(r'original values')
y2 = [fund(xx, popt[0], popt[1], popt[2]) for xx in x2]
ax.plot(x2, y2, 'r--', label='polyfit values')
ax.set_title('curve_fit方法拟合')
ax.set_xlabel('x')
ax.set_ylabel('y')
ax.legend()
print(popt)
plt.show()