李宏毅：错误来自于什么地方——过拟合与欠拟合及其解决方案

最新推荐文章于 2022-06-21 13:47:44 发布

yilyil

最新推荐文章于 2022-06-21 13:47:44 发布

阅读量240

点赞数

分类专栏： # 机器学习文章标签： python 机器学习 sklearn

本文链接：https://blog.csdn.net/qq_42146775/article/details/115914875

版权

14 篇文章 2 订阅

订阅专栏

一丶总述：要问你的error来自哪里

就像下面这张图， $\overset{\frown} {f}$ 是理想的函数， $f^*$ 是你现在找到的函数，bias 和 variance 就是你打偏的原因，打个比方就如同这幅图，你打靶的时候瞄准的点与靶心是有bias的，并且子弹射出去，也会与瞄准的点有variance的
在这里插入图片描述

简单的model	复杂的model
大的bias	小的bias
小的variance	大的variance
model就是函数集合，一个简单的model所代表的的范围小，而复杂的包含的范围大	简单的model受不同样本数据的影响更小,复杂的受影响大

黑线代表：真实函数，红线代表5000个函数集合，蓝色就是5000个函数取平均值	黑线代表：真实函数，红线代表5000个函数集合，蓝色就是5000个函数取平均值

在这里插入图片描述
我们使用复杂高次方程会使我们瞄准的越来越准，但是散布会越来越大，当同时考虑两者，就是蓝色的线，我们需要选择一个平衡的点
所以如果error来自由variance 就是overfiting，来自bias就是underfiting

模型在训练集上不能很好的fit	能够fit训练数据，但是不能fit测试
bias很大	variance很大
欠拟合	过拟合
1. 采取的方法有输入更多的特征	1. 使用更多的数据但是现实往往没有这么多数据提供给你
2. 寻找更复杂的函数	2. 采用 regularization会强迫曲线平滑，那么只包含平滑的函数可能影响bias

在这里插入图片描述
虽然样本均值不等于 $\mu$ ，但其期望等于 $\mu$
样本会散落在 $\mu$ 附近，并且其偏离程度由 $\frac {\sigma^2}{n}{}$ 决定，又因为 $\sigma$ 不变，那么n越大，散布就会越集中

关注