机器学习概要1

最新推荐文章于 2022-07-07 20:54:01 发布

guiwin

最新推荐文章于 2022-07-07 20:54:01 发布

阅读量438

点赞数

分类专栏：机器学习文章标签：机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guiwin/article/details/82354503

版权

本文介绍了机器学习模型的设计准则，强调了模型复杂度与欠拟合、过拟合的关系，并探讨了无免费午餐定理和奥卡姆剃刀原则。此外，文章详述了模型验证方法如交叉验证和自助采样，以及评估指标如混淆矩阵、P-R曲线和ROC曲线。还涉及了特征预处理、线性回归、正则化处理、线性降维和非线性降维等核心概念。

摘要由CSDN通过智能技术生成

模型的误差包括三个部分：偏差（bias），方差（variance）和噪声（noise）。

模型的设计准则

当模型本身过于复杂时，特征和类别之间的关系中所有的细枝末节都被捕捉，主要的趋势反而在乱花渐欲迷人眼中没有得

到应有的重视，这就会导致过拟合（overfitting）的发生。反过来，如果模型过于简单，它不仅没有能力捕捉细微的相关性，甚

至连主要趋势本身都没办法抓住，这样的现象就是欠拟合（underfitting）。

无免费午餐定理说明模型的选取要以问题的特点为根据；
奥卡姆剃刀说明在性能相同的情况下，应该选取更加简单的模型；
过于简单的模型会导致欠拟合，过于复杂的模型会导致过拟合；
从误差分解的角度看，欠拟合模型的偏差较大，过拟合模型的方差较大。

模型的验证方法

由于模型的泛化性能和它的复杂度是直接挂钩的，所以模型验证的任务就是确定模型的复杂度以避免过拟合的发生。

模型验证的作用是选择最佳模型并确定其性能；
对数据的重采样可以直接实现对样本外误差，也就是泛化误差的估计；

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。