java学习曲线_学习曲线（高偏差/高差异）为什么测试学习曲线变得平坦

最新推荐文章于 2021-08-11 17:33:34 发布

Dj电鹿板

最新推荐文章于 2021-08-11 17:33:34 发布

阅读量190

点赞数

文章标签： java学习曲线

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_32262035/article/details/114654886

版权

本文作者通过绘制渐变增强决策树模型的学习曲线来评估其性能。发现测试分数曲线在样本数量增加时提升缓慢，趋于平坦，这通常表明高偏差（欠拟合）。然而，训练和测试分数之间的差距暗示可能存在高差异（过拟合）。作者寻求对此现象的解释，并分享了用于绘制学习曲线的代码。

摘要由CSDN通过智能技术生成

我使用渐变增强决策树作为分类器实现了一个模型，我绘制了训练和测试集的学习曲线，以决定下一步做什么以改进我的模型 . 结果如图：

(Y轴是精度(正确预测的百分比)，而x轴是我用来训练模型的样本数 . )

我知道训练和测试分数之间的差距可能是由于高差异(过度拟合) . 但是图像还显示测试分数(绿线)增加很少，而样本数量从2000增加到3000.测试分数的曲线变得平缓 . 即使有更多的样本，模型也没有变得更好 .

我的理解是，平坦的学习曲线通常表示高偏差(欠拟合) . 在这个模型中是否可能发生过度拟合和过度拟合？或者平曲线有另一种解释吗？

任何帮助，将不胜感激 . 提前致谢 .

=====================================

我使用的代码如下 . 基本我使用与sklearn中的示例相同的代码document

def plot_learning_curve(estimator, title, X, y, ylim=None, cv=None,

n_jobs=1, train_sizes=np.linspace(.1, 1.0, 5)):

p

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。