周志华机器学习--模型评估与选择

最新推荐文章于 2024-01-20 22:58:37 发布

馒头没有馅儿yolo

最新推荐文章于 2024-01-20 22:58:37 发布

阅读量783

点赞数

分类专栏：机器学习文章标签：人工智能

本文链接：https://blog.csdn.net/weixin_45448833/article/details/128298321

版权

机器学习专栏收录该内容

5 篇文章 1 订阅

订阅专栏

周志华机器学习–模型评估与选择

第一章绪论
第二章模型评估与选择
第三章线性模型
第四章决策树
第五章支持向量机
第六章神经网络
第七章贝叶斯分类器
第八章集成学习和聚类

文章目录

周志华机器学习--模型评估与选择
一、泛化能力
二、过拟合和欠拟合
三、三大问题
四、评估方法
五、调参与验证集
六、性能度量
七、比较检验

一、泛化能力

泛化能力强：能很好适用于unseen instance
e.g.，错误率低、精度高、召回能力强（以上指标视具体任务和使用者需求而异）

二、过拟合和欠拟合

泛化误差：在“未来”样本上的误差
经验误差：在训练集上的误差，亦称为“训练误差”
Q：是否泛化or经验误差越小越好？
A：不是！
过拟合（overfitting）：经验误差过小，模型学习到了训练数据满足的特有性质，但这些性质不是一般规律
欠拟合（underfitting）：经验误差过大，模型没有学习到足够的一般规律

SO 机器学习重要的问题：用什么方法缓解overfitting？什么情况下此方法会失效？

三、三大问题

模型选择三大关键问题：

如何获得测试结果？–评估方法
如何评估性能优劣？–性能度量
如何判断实质差别？–比较检验

四、评估方法

** 留出法（hold-out）**
在这里插入图片描述

存在问题：尽管随机取多次，可能仍会遗漏某些数据
k-折交叉验证法可避免这个问题

交叉验证法（cross validation）
在这里插入图片描述

但因为切分可能存在偏差，可以做10次不同的切分，就成了10*10 CV，也是做100次试验
留一法（leave-one-out）：M99逼近M100是否比M90逼近M100更准确呢？ NO！因为no free lunch

自助法（bootstrp）

请添加图片描述

不出现的样本当作测试集
优点：既能逼近M100，还能留出样本做测试
最大的缺陷：数据分别有所改变（适用于数据分布不重要，或数据量不够的情况

五、调参与验证集

请添加图片描述

验证集–从训练集分出一部分用以调整参数
调参数的过程也是训练的过程，不能用测试集进行调参，因为测试集里的数据一定要是训练时没有出现的数据

六、性能度量

性能度量反映了任务需求
请添加图片描述

查准率：当西瓜收购公司去瓜摊收购西瓜时希望保证收到的瓜中坏瓜尽可能的少
查全率：当西瓜收购公司去瓜摊收购西瓜时希望把好瓜都收走

F1度量结合了P和R：当西瓜收购公司去瓜摊收购西瓜时既希望把好瓜都收走又保证收到的瓜中坏瓜尽可能的少
F1度量使较小的值不被忽视