【机器学习基础】从回归问题引基础:多项式曲线拟合

这篇博客介绍了机器学习中通过多项式曲线拟合进行数据建模的方法,讨论了过拟合问题,并引入了正则化技术来控制模型复杂度。文章通过具体的例子展示了不同阶数多项式对数据的拟合效果,以及正则化参数λ对模型的影响。
摘要由CSDN通过智能技术生成

本系列为《模式识别与机器学习》的读书笔记。

一, 举例:多项式曲线拟合

假设给定一个训练集。这个训练集由 x x x N N N 次观测组成,写作 x ≡ ( x 1 , … , x N ) T \mathbf{x}\equiv(x_1,\dots, x_N)^T x(x1,,xN)T ,伴随这对应的 t t t 的观测值,记作 t ≡ ( t 1 , … , t N ) T \mathbf{t}\equiv (t_1,\dots, t_N)^T t(t1,,tN)T。其中,输入数据集合 x \mathbf{x} x 通过选择 x n ( n = 1 , … , N ) x_n(n=1,\dots,N) xn(n=1,,N) 的值来生成,这些 x n x_n xn 均匀分布在区间[0, 1],目标数据集 t \mathbf{t} t 的获得方式是:首先计算函数 s i n ( 2 π x ) sin(2\pi x) sin(2πx) 的对应的值,然后给每个点增加一个小的符合高斯分布的随机噪声,从而得到对应的 t n t_n tn 的值。 我们的目标是利用这个训练集预测对于输入变量的新值 x ^ \hat{x} x^ 得到的目标变量的值 t ^ \hat{t} t^

如下图1.1,由 N N N =10个数据点组成的训练集的图像,用蓝色圆圈表示。
训练集
如图1.2,误差函数对应于每个数据点与函数 y ( x , w ) y(x, \boldsymbol{w}) y(x,w) 之间位移(绿⾊垂直线)的平⽅和(的⼀半)。
误差分析
但是现在,我们要⽤⼀种相当⾮正式的、相当简单的⽅式来进⾏曲线拟合。特别地,将使⽤下⾯形式的多项式函数来拟合数据:

y ( x , w ) =

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值