机器学习中的偏差(bias)和方差(variance)

Timmy_Y

于 2016-12-21 18:39:39 发布

阅读量1.8w

点赞数 11

分类专栏：机器学习机器学习笔记文章标签：机器学习偏差和方差 bias and variance 过拟合和欠拟合模型评价

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mingtian715/article/details/53789487

版权

机器学习同时被 2 个专栏收录

33 篇文章

订阅专栏

机器学习笔记

23 篇文章

订阅专栏

内容参见stanford课程《机器学习》

对于已建立的某一机器学习模型来说，不论是对训练数据欠拟合或是过拟合都不是我们想要的，因此应该有一种合理的诊断方法。

偏差和方差

评价数据拟合程度好坏，通常用代价函数J（平方差函数）。如果只关注Jtrain(训练集误差)的话，通常会导致过拟合，因此还需要关注Jcv(交叉验证集误差)。

高偏差：Jtrain和Jcv都很大，并且Jtrain≈Jcv。对应欠拟合。

高方差：Jtrain较小，Jcv远大于Jtrain。对应过拟合。

下图d代表多项式拟合的阶数，d越高，拟合函数越复杂，越可能发生过拟合。

如何理解高偏差和高方差

1、高偏差对应着欠拟合，此时Jtrain也较大，可以理解为对任何新数据（不论其是否属于训练集），都有着较大的Jcv误差，偏离真实预测较大。

2、高方差对应着过拟合，此时Jtrain很小，对于新数据来说，如果其属性与训练集类似，它的Jcv就会小些，如果属性与训练集不同，Jcv就会很大，因此有一个比较大的波动，因此说是高方差。

实际优化过程中，更多的是调整防止过拟合参数λ，λ 对应正则化系数（越大，对过拟合的限制越强）。下图为λ和Jtrain、Jcv理想曲线。

学习曲线

学习曲线是描述Jtrain和Jcv和数据样本规模的关系曲线。参见下图

左图对应高偏差（欠拟合），右图对应过拟合。可以看出当模型属于高偏差时，随着样本数据规模增大，性能不会有什么改善，过拟合中的误差则在持续减小。这个很好理解，欠拟合一般是模型比较简单，不能准确的描述数据特征，因此盲目增大数据量是没用的；而过拟合是模型比较复杂，描述数据过于准确了，因此增加一些数据量可以减小过拟合。

模型修改策略

过拟合：增大数据规模、减小数据特征数（维数）、增大正则化系数λ

欠拟合：增多数据特征数、添加高次多项式特征、减小正则化系数λ

实际优化过程中，我们的目标就是使模型处于欠拟合和过拟合之间一个平衡的位置。

博客等级

码龄13年

56
原创

505
点赞

2614
收藏

430
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

有关Pca的使用：样本数目和降维数目的关系
scarlett928: 谢谢博主，解决了我一直以来困惑的问题！
有关Pca的使用：样本数目和降维数目的关系
qq_42711025: 那么有什么降维方法可以满足降维后特征数大于样本数，小于原始特征数呢？
MATLAB中GUI的使用技巧（1）之axes
侠客行-正心诚意: 我也是这个，类 Axes 的属性 imshow(f) 无法识别。% f = imread('D:\机器视觉代码\matlab\测试2.jpeg'); % subplot 221 imshow(f); % subplot 222 imhist(f); % ylim('auto'); % q = histeq(f,256); % subplot 223 imshow(q); % subplot 224 imhist(q); % ylim('auto') %类 Axes 的属性 imshow(f) 无法识别???
Scikit-learn实例之Pca+Svm人脸识别(AT&T数据集)
大栗子呀: 因为后面博主修改成了10个特征向量，所以画图的地方将n_col设置小一点等于3就可以了，这样只有9张图，小于10
Scikit-learn实例之Pca+Svm人脸识别(AT&T数据集)
大栗子呀: 我把测试集占的比例改成0.5就有40类了，之前应该是测试集太小了导致有一类不在测试集

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。