利用STL算法实现最小二乘直线拟合
问题描述
给定一组观测数据(x1,y1),(x2,y2),(x3,y3),...,(xn,yn)
,目标是拟合一条直线y = ax + b
,其中a,b
是待求参数,使得直线与观测值之差的平方和最小,即
求解上述方程,容易得到参数的解是
其中
例如(数据来源:维基百科)
随机选定10艘战舰,并分析它们的长度与宽度,寻找它们长度与宽度之间的关系。由下面的描点图可以直观地看出,一艘战舰的长度(x)与宽度(y)基本呈线性关系。
表1 10艘战舰的长度和宽度观测数据
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
---|---|---|---|---|---|---|---|---|---|---|
x | 208 | 152 | 113 | 227 | 137 | 238 | 178 | 104 | 191 | 130 |
y | 21.6 | 15.5 | 10.4 | 31.0 | 13.0 | 32.4 | 19.0 | 10.4 | 19.0 | 11.8 |
图1 战舰长、宽观测数据散点图,基本呈线性关系
图2 战舰长、宽观测数据拟合直线的结果
代码
#include <iostream>
#include <cmath>
#include <vector>
#include <numeric>
using namespace std;
//可以利用vector保存x,y的数据。利用accumulate和inner_product算法可以很快速的计算x,y的均值和内积。
//x, y表示观测数据,a,b表示直线参数,error表示拟合误差, error = sum((ax+b - y)^2)
void least_squre(vector<float> &x, vector<float> &y, float &a, float &b, float &error) {
vector<float> ans(x.size());
float ux, uy;
ux = accumulate(x.begin(), x.end(), 0) / x.size();
uy = accumulate(y.begin(), y.end(), 0) / y.size();
a = (inner_product(x.begin(), x.end(), y.begin(), 0.0) / x.size() - ux * uy)
/ (inner_product(x.begin(), x.end(), x.begin(), 0.0) / x.size() - ux * ux);
b = uy - a * ux;
for (int i = 0; i < x.size(); ++i) {
ans[i] = pow(a * x[i] + b - y[i], 2);
}
error = accumulate(ans.begin(), ans.end(), 0.0);
}
int main() {
//两组测试数据
float x1[] = {6.19f, 2.51f, 7.29f, 7.01f, 5.7f, 2.66f, 3.98f, 2.5f, 9.1f, 4.2f};
float y1[] = {5.25f, 2.83f, 6.41f, 6.71f, 5.1f, 4.23f, 5.05f, 1.98f, 10.5f, 6.3f};
float x2[] = {208.0f, 152.0f, 113.0f, 227.0f, 137.0f, 238.0f, 178.0f, 104.0f, 191.0f, 130.0f};
float y2[] = {21.6f, 15.5f, 10.4f, 31.0f, 13.0f, 32.4f, 19.0f, 10.4f, 19.0f, 11.8f};
//将数组转换为vector (其实不转也没关系)
vector<float> xx1(x1, x1 + 10);
vector<float> yy1(y1, y1 + 10);
vector<float> xx2(x2, x2 + 10);
vector<float> yy2(y2, y2 + 10);
printf("data1:\n");
//调用拟合函数
float a, b, ux, uy, sum1, sum2, error;
least_squre(xx1, yy1, a, b, error);
printf("y = %fx + %f\na = %f b = %f\n", a, b, a, b);
//输出拟合结果
printf("error: %f\n", error);
printf("data2:\n");
//调用拟合函数
least_squre(xx2, yy2, a, b, error);
printf("y = %fx + %f\na = %f b = %f\n", a, b, a, b);
//输出拟合结果
printf("error: %f\n", error);
return 0;
}
data1:
y = 0.810352x + 1.758593
a = 0.810352 b = 1.758593
error: 13.517198
data2:
y = 0.178578x + -11.822569
a = 0.178578 b = -11.822569
error: 51.588383