拟合算法

最新推荐文章于 2023-07-14 17:44:07 发布

Auraros

最新推荐文章于 2023-07-14 17:44:07 发布

阅读量1.3k

点赞数

分类专栏： # 数学建模算法文章标签：拟合算法

本文链接：https://blog.csdn.net/qq_43634001/article/details/103431255

版权

数学建模算法专栏收录该内容

3 篇文章 1 订阅

订阅专栏

拟合算法

与插值问题不同，在拟合问题中不需要曲线一定经过给定的点。拟合问题的目标是寻求一个函数（曲线），使得该曲线在某种准则下与所有的数据点最为接近，即曲线拟合的最好（最小化损失函数）

什么时候用插值和拟合？
当样本量少于30的时候优先选择插值算法，当样本量比较多的时候，优先考虑拟合。

1. 最小二乘法的几何解释

设这些样本点为 $x_i,y_i),i = 1,2,...,n$ 我们设置的拟合曲线为 $y = k x + b$
问题： k和b取何值时，样本点和拟合曲线最为接近

第一种定义：
$\hat y_i = kx_i + b$
$\hat k, \hat b = \argmin_{k, b}(\sum_{i=1}^n|y_i-\hat y_i|)$

第二种定义：
$\hat y_i = kx_i + b$
$\hat k, \hat b = \argmin_{k, b}(\sum_{i=1}^n(y_i-\hat y_i)^2)$

第一个定义具有绝对值，不容易求导，因此计算比较复杂，所以往往使用第二种定义，也就是最小二乘的思想。

2. 求解最小二乘法

设这些样本点为 $x_i,y_i),i=1,2,...,n$ ,设我们设置的拟合曲线为 $y = k x + b$ 令拟合值为 $\hat y_i = kx_i +b$
那么 $\hat k,\hat b=\argmin_{k,b}(\sum_{i=1}^n(y_i-\hat y_i)^2)=\argmin_{k,b}(\sum_{i=1}^n(y_i-kx_i-b)^2)$
令 $\sum_{i=1}^n(y_i-kx_i-b)^2$ ，现在要找 k, b 使得L最小。（L在机器学习种被称为损失函数，在统计学习种也常被称为残差平方和）
证明省略
得到：
$\hat k=\frac{n\sum_{i=1}^nx_iy_i-\sum_{i=1}^ny_i\sum_{i=1}^nx_i}{n\sum_{i=1}^nx_i^2-\sum_{i=1}^nx_i\sum_{i=1}^nx_i}$

$\hat b=\frac{\sum_{i=1}^nx_i^2\sum_{i=1}^ny_i-\sum_{i=1}^nx_i\sum_{i=1}^nx_iy_i}{n\sum_{i=1}^nx_i^2-\sum_{i=1}^nx_i\sum_{i=1}^nx_i}$

clear;clc
load  data1
plot(x,y,'o')
% 给x和y轴加上标签
xlabel('x的值')
ylabel('y的值')
n = size(x,1);
k = (n*sum(x.*y)-sum(x)*sum(y))/(n*sum(x.*x)-sum(x)*sum(x))
b = (sum(x.*x)*sum(y)-sum(x)*sum(x.*y))/(n*sum(x.*x)-sum(x)*sum(x))
hold on % 继续在之前的图形上来画图形
grid on % 显示网格线

f=@(x) k*x+b;
fplot(f,[min(x)-1,max(x)+1]);
legend('样本数据','拟合函数','location','SouthEast')

3.如何评价拟合的好坏

拟合优度（可决系数） $R^2$
总体平方和SST： $SST=\sum_{i=1}^n(y_i-\sum_{i=1}^ny/n)$
误差平方和SSE: $SSE=\sum_{i=1}^n(y_i-\hat y)^2$
回归平方和SSR: $SSR=\sum_{i=1}^n(\hat y_i-\sum_{i=1}^ny/n)$
可以证明： SST = SSE +SSR
拟合优度：
$\leq R^2 = \frac{SSR}{SST}=\frac{SST-SSE}{SST} = 1-\frac{SSE}{SST}\leq1$
$R^2$ 越接近1，说明误差平方和越接近0，误差越小说明拟合越好。
（注意： $R^2$ 只能用于拟合函数是线性函数时，拟合结果评价）
线性函数和其他函数（例如指数函数）比较拟合的好坏，直接看SSE即可

y_hat = k*x+b; % y的拟合值
SSR = sum((y_hat-mean(y)).^2)  % 回归平方和
SSE = sum((y_hat-y).^2) % 误差平方和
SST = sum((y-mean(y)).^2) % 总体平方和
SST-SSE-SSR
R_2 = SSR / SST

Auraros

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
拟合算法

拟合算法与插值问题不同，在拟合问题中不需要曲线一定经过给定的点。拟合问题的目标是寻求一个函数（曲线），使得该曲线在某种准则下与所有的数据点最为接近，即曲线拟合的最好（最小化损失函数）什么时候用插值和拟合？当样本量少于30的时候优先选择插值算法，当样本量比较多的时候，优先考虑拟合。1. 最小二乘法的几何解释设这些样本点为(xi,yi),i=1,2,...,n(x_i,y_i),i = 1,...
复制链接

扫一扫

专栏目录