最小二乘法多项式曲线拟合数学原理及其C++实现

最新推荐文章于 2023-03-17 08:15:00 发布

那天，乌江边上

最新推荐文章于 2023-03-17 08:15:00 发布

阅读量3.3k

点赞数 10

分类专栏：多传感器信息融合

本文链接：https://blog.csdn.net/u012494154/article/details/112519550

版权

本文详细介绍了最小二乘法在自动驾驶中的应用，用于多项式曲线拟合。通过数学推导，将非线性回归问题转化为线性回归，利用Eigen库在C++中实现。文章比较了矩阵法、正规方程、Householder QR分解和BDCSVD分解在速度和精度上的差异，展示了最小二乘法在解决线性最小二乘问题上的优缺点。

摘要由CSDN通过智能技术生成

0 前言

自动驾驶开发中经常涉及到多项式曲线拟合，本文详细描述了使用最小二乘法进行多项式曲线拟合的数学原理，通过样本集构造范德蒙德矩阵，将一元 N 次多项式非线性回归问题转化为 N 元一次线性回归问题，并基于线性代数 C++ 模板库——Eigen 进行了实现，最后，比较了几种实现方法在求解速度与求解精度上的差异。

1 最小二乘法概述

最小二乘法（Least Square Method，LSM）通过最小化误差（也叫残差）的平方和寻找数据的最优函数匹配。

假设给定一组样本数据集 $P (x, y)$ ， $P$ 内各数据点 $P_i(x_i, y_i) (i=1, 2, 3, ..., m)$ 来自于对多项式

$f(x_i)=θ_0+θ_1x_i+θ_2x_i^2+···+θ_nx_i^n$

的多次采样，其中：

$m$ 为样本维度
$n$ 为多项式阶数
$θ_j (j=1, 2, 3, ..., n)$ 为多项式的各项系数

针对样本数据集 $P$ 内各数据点的误差平方和为：

$S=\sum_{i=1}^m[f(x_i)-y_i]^2$

最小二乘法认为，最优函数的各项系数 $θ_j (j=1, 2, 3, ..., n)$ 应使得误差平方和 $S$ 取得极小值。最小二乘法与极大似然估计有着密切的联系，关于最小二乘法的数学本质可参考文章《如何理解最小二乘法？》。

2 最小二乘法求解多项式曲线系数向量的数学推导

2.1 代数法

由于最优函数的各项系数 $θ_j (j=1, 2, 3, ..., n)$ 使得误差平方和 $S$ 取得极小值，因而，对于最优函数而言，其误差平方和 $S$ 对各多项式系i数 $θ_j (j=1, 2, 3, ..., n)$ 的偏导数应满足：

$\frac{\partial{S}}{\partial{θ_j}}=\sum_{i=1}^{m}[2(θ_0+θ_1x_i+θ_2x_i^2+···+θ_nx_i^n-y_i)x_i^j]=0$

整理上式， $j$ 分别取 $0, 1, 2, . . ., n$ 时，有：

$\begin{cases} mθ_0+(\sum\limits_{i=1}^{m}x_i)θ_1+(\sum\limits_{i=1}^{m}x_i^2)θ_2+\cdots+(\sum\limits_{i=1}^{m}x_i^n)θ_n=\sum\limits_{i=1}^{m}y_i \\ (\sum\limits_{i=1}^{m}x_i)θ_0+(\sum\limits_{i=1}^{m}x_i^2)θ_1+(\sum\limits_{i=1}^{m}x_i^3)θ_2+\cdots+(\sum\limits_{i=1}^{m}x_i^{n+1})θ_n=\sum\limits_{i=1}^{m}(x_iy_i) \\ (\sum\limits_{i=1}^{m}x_i^2)θ_0+(\sum\limits_{i=1}^{m}x_i^3)θ_1+(\sum\limits_{i=1}^{m}x_i^4)θ_2+\cdots+(\sum\limits_{i=1}^{m}x_i^{n+2})θ_n=\sum\limits_{i=1}^{m}(x_i^2y_i) \\ \cdots\cdots \\ (\sum\limits_{i=1}^{m}x_i^n)θ_0+(\sum\limits_{i=1}^{m}x_i^{n+1})θ_1+(\sum\limits_{i=1}^{m}x_i^{n+2})θ_2+\cdots+(\sum\limits_{i=1}^{m}x_i^{2n})θ_n=\sum\limits_{i=1}^{m}(x_i^ny_i) \end{cases}$