模型的选择、评估和优化-下

最新推荐文章于 2024-07-03 14:39:50 发布

braveryCHR

最新推荐文章于 2024-07-03 14:39:50 发布

阅读量1.1k

点赞数

分类专栏：机器学习文章标签：机器学习模型评估模型优化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bravery_again/article/details/81145118

版权

模型评估

上文叙述了当机器学习模型已经训练完成之后，我们该如何评估模型的好坏。

但是一般而言，机器学习模型的训练时间较长，在训练过程中，我们怎么样判断模型训练的状态和优劣呢？

之前说过，训练过程中的最容易出现的问题就是过拟合和欠拟合，下面介绍判断拟合状态的方法。

之前介绍过方差、偏差的概念以及他们的意义，在训练过程中，我们会得到训练集和测试集的总误差，通过这两个参数，我们可以判断出算法的拟合状态。

当出现欠拟合时，偏差高，方差低
当出现过拟合时，方差高，偏差低

拟合状态与样本规模

首先，无论是过拟合还是欠拟合，由于一个特定的函数对于更多的数据更难以拟合，但是对预测是有利的，所以训练集误差会增加，测试集误差会减少。

若出现欠拟合情形，增大数据量，训练集和测试集误差会趋于平缓，并且两者很接近，但是喂更多的数据基本无效。
若出现过拟合情形，增大数据量，训练集误差会持续增加，测试集误差会持续减少，并且两者相差较大。

这里写图片描述

拟合状态与正则化项

在线性回归、支持向量机等算法中，都会加入正则化项来防止过拟合，因为正则化项可以使得参数尽可能小。

J (h w (x), y) = - 1 m {\sum i = 1 m y i l o g (h w

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

braveryCHR CSDN认证博客专家 CSDN认证企业博客

码龄8年

12: 原创

110万+: 周排名

56万+: 总排名

11万+: 访问

: 等级

629: 积分

52: 粉丝

87: 获赞

8: 评论

410: 收藏

私信

关注

热门文章

分类专栏

机器学习 9篇
动态规划 3篇

最新评论

朴素和半朴素贝叶斯
CSDN-Ada助手: 非常感谢CSDN博主分享关于朴素和半朴素贝叶斯的知识，这篇博客让我对这两种贝叶斯分类方法有了更深入的理解。我觉得下一篇博客可以继续探讨贝叶斯分类算法的优化方法，比如基于特征选择的贝叶斯分类方法、基于贝叶斯网络的分类方法等等，这样的技术文章对其他用户也会非常有帮助。相信会有更多读者期待您的下一篇博客。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
决策树详解
weixin_44218113: 行了，这个富应该是根节点，只要是富都去
决策树详解
玛卡巴卡的手推车: nice
决策树详解
ZhuNian的学习乐园: https://blog.csdn.net/qq_41709378/article/details/105401986
决策树详解
三景页三景页: 很详细，学习了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。