Sklearn验证曲线

最新推荐文章于 2023-03-08 17:02:37 发布

数据科学家修炼之道

最新推荐文章于 2023-03-08 17:02:37 发布

阅读量182

点赞数

分类专栏： AI # Sklearn笔记文章标签： sklearn 验证曲线机器学习

本文为博主原创文章，欢迎转载，转载请注明出处。

本文链接：https://blog.csdn.net/xiligey1/article/details/112600715

版权

AI 同时被 2 个专栏收录

130 篇文章 7 订阅

订阅专栏

55 篇文章 0 订阅

订阅专栏

每种估计器都有其优势和缺陷。它的泛化误差可以用偏差、方差和噪声来分解。估计值的偏差是不同训练集的平均误差。估计值的方差用来表示它对训练集的变化有多敏感。噪声是数据的一个属性。

在下面的图中，我们可以看到一个函数 f(x) = \cos (\frac{3}{2} \pi x) 和这个函数的一些噪声样本。我们用三个不同的估计来拟合函数：多项式特征为1,4和15的线性回归。我们看到，第一个估计最多只能为样本和真正的函数提供一个很差的拟合，因为它太简单了(高偏差），第二个估计几乎完全近似，最后一个估计完全接近训练数据，但不能很好地拟合真实的函数，即对训练数据的变化（高方差）非常敏感。

http://sklearn.apachecn.org/cn/0.19.0/_images/sphx_glr_plot_underfitting_overfitting_0011.png

偏差和方差是估计所固有的属性，我们通常必须选择合适的学习算法和超参数，以使得偏差和方差都尽可能的低（参见偏差-方差困境）。另一种降低方差的方法是使用更多的训练数据。不论如何，如果真实函数过于复杂并且不能用一个方差较小的估计值来近似，则只能去收集更多的训练数据。

在一个简单的一维问题中，我们可以很容易看出估计值是否存在偏差或方差。然而，在高维空间中，模型可能变得非常难以具象化。出于这种原因，使用以下工具通常是有帮助的。

数据科学家修炼之道

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Sklearn验证曲线

每种估计器都有其优势和缺陷。它的泛化误差可以用偏差、方差和噪声来分解。估计值的偏差是不同训练集的平均误差。估计值的方差用来表示它对训练集的变化有多敏感。噪声是数据的一个属性。在下面的图中，我们可以看到一个函数 f(x) = \cos (\frac{3}{2} \pi x) 和这个函数的一些噪声样本。我们用三个不同的估计来拟合函数：多项式特征为1,4和15的线性回归。我们看到，第一个估计最多只能为样本和真正的函数提供一个很差的拟合，因为它太简单了(高偏差），第二个估计几乎完全近似，最后一个估计
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。