机器学习学习比价（四）-模型评估与选择

最新推荐文章于 2023-05-18 10:10:24 发布

宝剑磨，梅花寒

最新推荐文章于 2023-05-18 10:10:24 发布

阅读量529

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41989587/article/details/84666479

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

绪论
模型评估与选择（1）
模型评估与选择（2）
模型评估与选择（3）
线性模型（1）线性回归
决策树
神经网络
支持向量机
贝叶斯分类
集成学习
聚类
降维与度量学习
特征选择与稀疏学习
计算学习理论
半监督学习
概率图模型
规则学习
强化学习

模型评估与选择（3）

本次学习的都是一些检验不同学习器的性能是否相同的方法，在统计的过程当中大家应该都学过。

2.4.2 交叉验证t检验

对于两个学习器A和B，如果我们使用k折交叉验证法得到的测试错误率分
在这里插入图片描述
试集上得到的结果，则可以用k折交叉验证“成对t检验”来进行比较检验。
对每一折的测试错误率求差

很简单，用t检验比较两组数是否相等。

但是通常情况下，想要进行有效的假设检验，一个重要的前提是测试错误率均为泛化错误率的独立采样，然而，在使用交叉验证的时候，在不同轮次的训练集会有一定程度的重叠（比如说，10折交叉验证，每次就会有8个分组是相同的），这使得测试错误率实际上并不独立，会导致过高估计假设成立的概率。为缓解这一问题，可采用“5*2交叉验证”。

即做5次2折交叉验证，这样的化，在每一个轮次中，就不会出现分组重叠的情况。

对两个学习器A和B，第i次2折交叉验证将产生两对测试错误率，我们对他们分别求差，得到第1折上的差
在这里插入图片描述

2.4.3 McNemar检验
在这里插入图片描述

2.4.4 Friedman检验与Nemenyi

交叉验证t检验和McNemar检验都是在一个数据集上比较两个算法的性能，而当我们需要在一个数据集上对多个算法进行比较时，一种做法是在每个数据集上分别列出两两比较的结果；另一种方法是基于算法排序的Friedman检验。

假设我们用D1、D2、D3、D4四个数据集对算法A、B、C进行比较，首先，使用留出法或交叉验证法得到每个算法在每个数据集上的测试结果，然后在每个数据集上根据测试性能由好到坏排序，并赋予序值1，2，…；若算法的测试性能相同，则平分序值。例如，在D1和D3上，A最好、B其次、C最差…，则可列出表2.5。
在这里插入图片描述

2.5 偏差与方差
偏差-方差分解试图对学习算法的期望泛化错误进行拆解。
在这里插入图片描述

第二章节讲述的更多的是对学习器或分类器的性能评估，更多涉及到的是统计方面的知识，公式比较多。

宝剑磨，梅花寒

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

宝剑磨，梅花寒 CSDN认证博客专家 CSDN认证企业博客

码龄7年

20: 原创

52万+: 周排名

47万+: 总排名

16万+: 访问

: 等级

973: 积分

124: 粉丝

85: 获赞

10: 评论

375: 收藏

私信

关注

热门文章

分类专栏

matlab 4篇
统计 5篇
影像组学 2篇
python 3篇
Tensorflow 4篇
深度学习 2篇
机器学习 9篇

最新评论

扩散模型之DDPM
CSDN-Ada助手: 一定要坚持创作更多高质量博客哦, 小小红包, 以资鼓励, 更多创作活动请看: 令人惊艳的算法分享！: https://activity.csdn.net/creatActivity?id=10455?utm_source=csdn_ai_ada_redpacket 毕业季征文·未来可期: https://activity.csdn.net/creatActivity?id=10429?utm_source=csdn_ai_ada_redpacket AI写作助手创作测评: https://activity.csdn.net/creatActivity?id=10450?utm_source=csdn_ai_ada_redpacket 全部创作活动: https://mp.csdn.net/mp_blog/manage/creative?utm_source=csdn_ai_ada_redpacket
影像组学简述
成懂事长: 难懂
影像组学简述
「已注销」: 田教授的表在哪里可以查看嘛？
影像组学简述
doudou20151022: 很好，学习
统计学（二）之一般线性模型（一）
击溃牛顿哈里森: 固定因素指的是像老鼠的分类，随机因素就是比如气温变化

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。