西瓜书《机器学习》学习笔记二模型评估与选择（三）比较检验方差偏差

最新推荐文章于 2022-08-25 22:26:07 发布

无语ccy

最新推荐文章于 2022-08-25 22:26:07 发布

阅读量2.2k

点赞数

分类专栏：机器学习文章标签：机器学习西瓜书

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40795591/article/details/83007038

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

目录

4、比较检验

交叉验证t检验

Friedman检验与Nemenyi后续检验

5、偏差和方差

4、比较检验

这部分主要介绍当我们使用某种实验评估方法测得学习器的某个性能度量结果时，我们要如何进行比较，判断学习器的优劣。也就是性能比较，性能比较主要有以下几个重要因素：

我们一开始就应该很明确，我们希望比较的是学习器的泛化性能，但性能度量结果可能和泛化性能并不相同；

测试集上的性能与测试集本身的选择有很大的关系，测试集不同，结果可能也会发生改变；

很多机器学习算法具有很大的随机性，同一份测试集多次测试结果也可能不同；

统计假设检验（hypothesis test）为学习器性能的比较提供了重要依据。它的重要作用是：基于假设验证的结果，我们可以推断出，若在测试集上观察到的学习器A比B好，则A的泛化性能是否在统计意义上比B好，以及这个结论的把握有多大。

假设检验

关于单个学习器泛化性能的假设进行检验；假设测试错误率为a，通过统计学公式计算可得，在A概率下泛化错误率小于等于a，在1-A概率下泛化错误率大于a。概率A反映了结论的“置信度”（confidence）

如果想看推理计算过程，可以查阅周志华老师《机器学习》2.4节。

交叉验证t检验

McNemar检验

Friedman检验与Nemenyi后续检验

交叉验证t检验和McNemar检验都是在一个数据集上比较两个算法的性能，当我们需要在一组数据集上对多个算法进行比较时，一种做法是：在每个数据集上分别列出两两比较的结果，而在两两比较时可使用上面几种方法；另一种方法更为直接，即使用基于算法排序的Friedman检验。

5、偏差和方差

泛化误差 = 偏差 + 方差 + 噪声

偏差：度量了学习算法的期望预测与真实结果的偏离程度，即刻画了学习算法本身的拟合能力；

方差：度量了同样大小的训练集的变动所导致的学习性能的变化，即刻画了数据扰动所造成的影响；

噪声：表达了在当前任务上任何算法所能达到的期望泛化误差的下线，即刻画了学习问题本身的难度；

“偏差-方差分解”说明，泛化性能是由学习算法的能力、数据额充分性以及学习任务本身的难度所共同决定的。

给定学习任务，为了取得好的泛化性能，则需使偏差较小，即能够充分拟合数据，并且使方差较小，即使得数据扰动产生的影响小。

一般来说，方差和偏差是冲突的，这称为偏差-方差窘境（bias-variance dilemma）;

本一章节理论性较强，看的有点吃力，特别是公式推导的部分，所以有兴趣的同学还是去看原书的公式推导过程会比较清晰。

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄7年

9
原创

14
点赞

99
收藏

7
粉丝

关注

私信

热门文章

分类专栏

OPENCV 2篇
机器学习 6篇
图像处理 2篇
python 1篇

最新评论

randon变换（拉东变换）
Recklessoor: 博主你好，请问对图像进行radon变换时候的默认坐标轴原点是在哪里，ρ的距离远近对结果有什么影响
opencv CV_EXPORTS含义
avin.wang: 博主您好！“defined(CVAPI_EXPORTS)”这句里，好像没有找到CVAPI_EXPORTS这个宏的定义，所以这句不应该是FALSE吗？如果是FALSE，define CV_EXPORTS __declspec(dllexport)这句怎么会生效呢？
im2col运算 - 一种卷积优化算法
「已注销」: for (int channel=img.channels();channel--;channel>0) channel>0有什么作用吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。