通过偏差/方差大小判断模型

最新推荐文章于 2024-08-08 16:43:27 发布

瑶子ove

最新推荐文章于 2024-08-08 16:43:27 发布

阅读量2.9k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40924580/article/details/81626949

版权

本文介绍了如何通过偏差/方差分析来评估机器学习模型的性能，提供了解决高偏差和高方差的方法，如调整特征数量、正则化程度，并详细阐述了模型选择过程，包括使用训练集、测试集和交叉验证集进行模型选择和正则化参数λ的选择。学习曲线被用来在过拟合和欠拟合情况下指导更多数据的引入以提升算法效果。

摘要由CSDN通过智能技术生成

获得更多的训练实例——通常是有效的，但代价较大，下面的方法也可能有效，可
考虑先采用下面的几种方法。————解决高方差
尝试减少特征的数量 ————解决高方差
尝试获得更多的特征 ————解决高偏差
尝试增加多项式特征 ————解决高偏差
尝试减少正则化程度λ ———解决高偏差
尝试增加正则化程度λ ———解决高方差

绍怎样评估机器学习算法的性能？？？
“机器学习诊断法”

判断是否过拟合：们将数据分成训练集和测试集，通常用 70%的数据作为训练集，用剩下 30%的数据作为测试集。很重要的一点是训练集和测试集均要含有各种类型的数据，通常我们要对数据进行“洗牌”，然后再分成训练集和测试集

对于线性回归模型，我们利用测试集数据计算代价函数 J
对于逻辑回归模型，我们除了可以利用测试数据集来计算代价函数外：

误分类的比率，对于每一个测试集实例，计算：

然后对计算结果求平均

模型选择和交叉验证集：

60%数据作为训练集，20%数据作为交叉验证集，20%作为测试集。
模型选择方法：
1 使用训练集训练出10个模型
2 用10个模型分别对交叉验证集计算得出交叉验证误差(代价函数的值)
3 选取代价函数最小的模型
4 用3选出的模型对测试集计算得出推广误差（代价函数的值）

如果算法表现不理想，主要是两种情况：1）偏差比较大，high bias——欠拟合；2）方差比较大，high variance—

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。