机器学习中拟合与过拟合

最新推荐文章于 2023-12-21 12:51:33 发布

Nicolos_Z

最新推荐文章于 2023-12-21 12:51:33 发布

阅读量970

点赞数 2

分类专栏： deep learning 文章标签：拟合过拟合

本文链接：https://blog.csdn.net/USTC_Zn/article/details/77084388

版权

deep learning 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

拟合的基础概念。

首先任何函数都可以用多项式f(x)的方式去趋近,因此我们令f(x) = w0x0+w1x1+...+wnxn.

首先，用一个例子来理解什么是过拟合，假设我们要根据特征分类{男人X，女人O}。

请看下面三幅图，x1、x2、x3；

这三幅图很容易理解：
1、图x1明显分类的有点欠缺，有很多的“男人”被分类成了“女人”。
2、图x2虽然有两个点分类错误，但是能够理解，毕竟现实世界有噪音干扰，比如有些人男人留长发、化妆、人妖等等。
3、图x3分类全部是正确的，但是看着这副图片，明显觉得过了，连人妖都区分的出来，可想而知，学习的时候需要更多的参数项，甚至将生殖器官的形状、喉结的大小、有没有胡须特征等都作为特征取用了，总而言之f(x)多项式的N特别的大，因为需要提供的特征多，或者提供的测试用例中我们使用到的特征非常多(一般而言，机器学习的过程中，很多特征是可以被丢弃掉的)。

好了，总结一下三幅图：
x1我们称之为【欠拟合】
x2我们称之为【分类正拟合】，随便取的名字，反正就是容错情况下刚好的意思。
x3我们称之为【过拟合】，这种情况是我们不希望出现的状况，为什么呢？很简单，它的分类只是适合于自己这个测试用例，对需要分类的真实样本而言，实用性可想而知的低。

恩，知道了过拟合是怎么回事之后，我们来看一下如何去规避这种风险。先不管什么书上说的、老师讲的、经验之说之类的文言文。咱们就站在第一次去接触这种分类模型的角度去看待这个问题，发散一下思维，我们应该如何去防止过拟合？
显而易见，我们应该从【过拟合】出现的特征去判别，才能规避吧？
显而易见，我们应该、而且只能去看【过拟合】的f(x)形式吧？
显而易见，我们从【过拟合】的图形可以看出f(x)的涉及到的特征项一定很多吧，即x1,x2,...xn等等很多

显而易见，N很大的时候，w0,w1,...wn是等数量增长的吧？
显而易见，w系数都是学习来的吧？

So，现在知道这些信息之后，如何去防止过拟合，我们首先想到的就是控制N的数量吧，即让N最小化吧，而让N最小化，其实就是让W向量中项的个数最小化吧？
其中，W=(w0,w1,...wn)

Nicolos_Z

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
机器学习中拟合与过拟合

拟合的基础概念。首先任何函数都可以用多项式f(x)的方式去趋近,因此我们令f(x) = w0x0+w1x1+...+wnxn.首先，用一个例子来理解什么是过拟合，假设我们要根据特征分类{男人X，女人O}。请看下面三幅图，x1、x2、x3；这三幅图很容易理解：1、图x1明显分类的有点欠缺，有很多的“男人”被分类成了“女人”。2、图x2虽然有
复制链接

扫一扫

专栏目录