一 Abstract
与插值问题不同,在拟合问题中不需要曲线一定经过给定的点。拟合问题的目标是去寻求一个函数(曲线),使得该曲线在某种准则下与所有的数据点最为接近,即曲线拟合的最好(最小化损失函数)
二 拟合算法
1.1 插值与拟合算法
- 插值: 得到的多项式 f ( x ) f(x) f(x)需要经过所有的样本点,但是如果样本点过多,那么这个多项式的次数会过高,因而造成Runge现象
- 拟合: 尽管可以用分段取避免插值的Runge问题,但是我们实际中更倾向于得到一个确定的曲线,虽然该曲线不能经过每一个样本点,但仅需要在确定时确保其产生的误差足够小即可 (拟合的结果是得到一个确定的曲线)
1.2 例子说明
- 先给处y和x的数据,现在需要找出y和x之间的拟合曲线
- 处理数据可以得到如下散点图:
- 确定拟合曲线
设这些样本点为 ( x i , y i ) , i = 1 , 2 , . . . , n (x_{i}, y_{i}), i=1, 2, ..., n (xi,yi),i=1,2,...,n,我们设置得拟合曲线为 y = k x + b y = kx+b y=kx+b
需要解决的问题是: k k k和 b b b为多少时,样本点和拟合曲线最接近
有两种定义: - 第一种定义: y ^ i = k x i + b k ^ , b ^ = a r g m i n k , b ( ∑ i = 1 n ∣ y i − y ^ i ∣ ) \hat y_{i} = kx_{i}+b \\ \hat k,\hat b = \mathop {argmin}\limits_{k,b}(\sum\limits_{i=1}^{n}\vert y_{i}-\hat y_{i} \vert) y^i=kxi+bk^,b^=k,bargmin(i=1∑n∣yi−y^i∣)
- 第二种定义: y ^ i = k x i + b k ^ , b ^ = a r g m i n k , b ( ∑ i = 1 n ( y i − y ^ i ) 2 ) \hat y_{i} = kx_{i}+b \\ \hat k,\hat b = \mathop{argmin}\limits_{k,b}(\sum\limits_{i=1}^{n}(y_{i}-\hat y_{i})^2) y^i=kxi+bk^,b^=k,bargmin(i=1∑n(yi−