c++椭圆最小二乘法原理_最小二乘法多项式曲线拟合数学原理及其C++实现

本文介绍了使用最小二乘法进行多项式曲线拟合的数学原理,详细阐述了从非线性回归到线性回归的转换,并通过C++的Eigen库展示了代码实现。内容包括矩阵法、范德蒙德矩阵的构造以及不同求解方法的性能对比。
摘要由CSDN通过智能技术生成

0 前言

自动驾驶开发中经常涉及到多项式曲线拟合,本文详细描述了使用最小二乘法进行多项式曲线拟合的数学原理,通过样本集构造范德蒙德矩阵,将一元 N 次多项式非线性回归问题转化为 N 元一次线性回归问题,并基于线性代数 C++ 模板库——Eigen 进行了实现,最后,比较了几种实现方法在求解速度与求解精度上的差异。

1 最小二乘法概述

最小二乘法(Least Square Method,LSM)通过最小化误差(也叫残差)的平方和寻找数据的最优函数匹配。

假设给定一组样本数据集

内各数据点

来自于对多项式

的多次采样,其中: 为样本维度

为多项式阶数

为多项式的各项系数

针对样本数据集

内各数据点的误差平方和为:

最小二乘法认为,最优函数的各项系数

应使得误差平方和

取得极小值。最小二乘法与极大似然估计有着密切的联系,关于最小二乘法的数学本质可参考文章《如何理解最小二乘法?》。

2 最小二乘法求解多项式曲线系数向量的数学推导

2.1 代数法

由于最优函数的各项系数

使得误差平方和

取得极小值,因而,对于最优函数而言,其误差平方和

对各多项式系i数

的偏导数应满足:

整理上式,

分别取

时,有:

转化为矩阵形式,令:

则有:

使用样本数据集构造出矩阵

和矩阵

后,便可由上式解得最优函数的系数向量

2.2 矩阵法

在代数法中,构造矩阵

和矩阵

较为繁琐且计算量大,我们尝试直接将误差平方和

拆解为矩阵形式。令:

则误差平方和

可写成:

是一个范德蒙矩阵(Vandermonde Matrix),

仍然是多项式系数构成的系数向量,

是样本数据集的输出向量。对于最优函数,应满足:

可求得最优函数的多项式系数向量

为:

相比代数法求解中的矩阵

和矩阵

,矩阵法中的矩阵

和矩阵

构造起来更加简单。仔细观察,可以发现:

说明两个解法是相通的。

3 代码实现

通过C++ Eigen库实现了矩阵法中的求解方式,Eigen版本为v3.3.7,运行环境为Windows10,Eigen库安装路径为 D:\eigen-3.3.7。

函数声明

#ifndef LEAST_SQUARE_METHOD_H#define LEAST_SQUARE_METHOD_H

#include #include

using namespace std;

/*** @brief Fit polynomial using Least Square Method.** @param X X-axis coordinate vector of sample data.* @param Y Y-axis coordinate vector of sample data.* @param orders Fitting order which should be larger than zero.* @return Eigen::VectorXf Coefficients vector of fitted polynomial.*/

Eigen::VectorXf FitterLeastSquareMethod(vector &X, vector &Y, uint8_t orders);

#endif

函数实现

#include "LeastSquareMethod.h"

/*** @brief Fit polynomial using Least Square Method.** @param X X-axis coordinate vector of sample data.* @param Y Y-axis coordinate vector of sample data.* @param orders Fitting order which should be larger than zero.* @return Eigen::VectorXf Coefficients vector of fitted polynomial.*/

Eigen::VectorXf FitterLeastSquareMethod(vector &X, vector &Y, uint8_t orders)

{

// abnormal input verification if (X.size() < 2 || Y.size() < 2 || X.size() != Y.size() || orders < 1)

exit(EXIT_FAILURE);

// map sample data from STL vector to eigen vector Eigen::Map<:vectorxf> sampleX(X.data(), X.size());

Eigen::Map<:vectorxf> sampleY(Y.data(), Y.size());

Eigen::MatrixXf mtxVandermonde(X.size(), orders + 1); // Vandermonde matrix of X-axis coordinate vector of sample data Eigen::VectorXf colVandermonde = sampleX; // Vandermonde column

// construct Vandermonde matrix column by column for (size_t i = 0; i < orders + 1; ++i)

{

if (0 == i)

{

mtxVandermonde.col(0) = Eigen::VectorXf::Constant(X.size(), 1, 1);

continue;

}

if (1 == i)

{

mtxVandermonde.col(1) = colVandermonde;

continue;

}

colVandermonde = colVandermonde.array()*sampleX.array();

mtxVandermonde.col(i) = colVandermonde;

}

// calculate coefficients vector of fitted polynomial Eigen::VectorXf result = (mtxVandermonde.transpose()*mtxVandermonde).inverse()*(mtxVandermonde.transpose())*sampleY;

return result;

}

在函数实现中使用了一些Eigen的小技巧:使用 Eigen::Map 直接将样本数据由 std::vector 映射到 Eigen::VectorXf 参与运算,避免了循环数据读入

通过 array() 方法累乘样本数据的X向量,逐列构造范德蒙矩阵,同样避免了大量的循环数据处理

拟合测试

#include #include "LeastSquareMethod.h"

using namespace std;

int main()

{

float x[5] = {1, 2, 3, 4, 5};

float y[5] = {7, 35, 103, 229, 431};

vector X(x, x + sizeof(x) / sizeof(float));

vector Y(y, y + sizeof(y) / sizeof(float));

Eigen::VectorXf result(FitterLeastSquareMethod(X, Y, 3));

cout << "\nThe coefficients vector is:\n" << endl;

for (size_t i = 0; i < result.size(); ++i)

cout << "theta_" << i << ": " << result[i] << endl;

return 0;

}

运行编译后的可执行程序,得到如下结果:

$ ./LSM.exe

The coefficients vector is:

theta_0: 1.30698

theta_1: 0.924561

theta_2: 2.0032

theta_3: 2.99976

点击这里下载完整的工程Demo,工程使用了 cmake 编译链,你也可以下载工程后使用其中的程序文件创建符合自己开发习惯的工程。

4 总结

本文中的矩阵法本质在于,通过样本集构造范德蒙德矩阵,将一元 N 次多项式非线性回归问题转化为 N 元一次线性回归问题(即多元线性回归)。对于线性回归问题的求解,Eigen 库中有多种实现:LU 分解

基于 Householder 变换的 QR 分解

完全正交分解(Complete Orthogonal Decomposition,COD)

标准 Cholesky 分解(LLT)

改进型 Cholesky 分解(LDLT)

SVD 分解

不同方法在对矩阵

的需求、求解速度、求解精度上有所差异,Eigen 官网对几种方法进行了对比总结,查看原文请移步 Linear algebra and decompositions 。Eigen 库中线性问题的几种求解方法对比

Eigen 官网在 Solving linear least squares systems 章节中讨论了 SVD 分解、QR 分解和正规方程(即使用 LDLT 解法)三种方法在求解线性最小二乘问题上的差异,并指出:SVD 分解通常精度最高但速度最慢,正规方程速度最快但精度最差,QR 分解性能介于两种方法之间。相比 SVD 分解和 QR 分解,当矩阵

病态时,正规方程解法所得结果将损失两倍精度。

利用上文所述的工程 Demo 中的小样本(三次多项式

附近的 5 个点)构造出范德蒙德矩阵(即矩阵

)后,对矩阵法(文中方法)、正规方程、householderQr 分解和 bdcSvd 分解进行了拟合实验对比:几种求解线性最小二乘问题方法的对比

从结果可以看出,在求解速度方面:

在求解精度方面:

householderQr 分解综合性能较优,矩阵法综合性能较差,且有

可逆的要求。

对于线性回归问题,还可通过梯度下降法进行求解,梯度下降法具体使用中还会涉及一些工程细节,例如数据的特征缩放(归一化)、步长

(学习率)的选择、迭代次数的设置等,具体不再展开,后面会另开一篇文章。

参考

如果觉得文章对你有所帮助的话,欢迎点赞/评论/收藏/关注,相互交流,共同进步~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值