三、比较检验

最新推荐文章于 2024-03-28 14:16:11 发布

_qz

最新推荐文章于 2024-03-28 14:16:11 发布

阅读量1.6k

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_45210226/article/details/109016174

版权

机器学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

文章目录

一、概述

比较检验的重要方法是统计假设检验，它为我们进行学习器性能比较提供了重要依据。

统计假设检验：
假设检验步骤：
带入机器学习：

二、具体检验方法

1. 估计假设精度

区分两种错误率：

errors（h）在何种程度上提供了对errorD(h)的估计？

2. 采样理论基础

在样本错误率和真实错误率之间的差异与数据样本大小的依赖关系如何？

在这里插入图片描述

符合二项分布（离散值）：
1. 期望或均值：np
2. 标准差：(np*（1-p））^(1/2)
估计偏差：

针对任意参数p的估计量Y的估计偏差为：E(Y)- P
如果估计偏差为0，我们称Y为P的无偏估计量。

对于二项分布，r的期望值为np。由此，并且因为n为一常数，那么 r/n 的期望值为P
一般来说，若在n个随机选取的样本中有r个错误，errors（h）的标准差为：

置信区间：

某个参数p的N%置信区间是一个以N%的概率包含P的区间

对于足够大的样本，二项分布可以很好的由正态分布来近似。

双侧和单侧边界：

3. 多次训练/测试的检验 - t检验

在这里插入图片描述
T的等式中，μ为测试错误率的均值；服从自由度为k-1的t分布（t分布是取样，正态分布是全体；当样本量趋于无穷大时，t分布就是正态分布）。

在这里插入图片描述

4. 交叉验证t检验

在这里插入图片描述

1. 基本思路

在这里插入图片描述

对这 k 个差值对 “学习器A和B的性能相同” 这个假设做 t 检验：
做5次2折交叉验证：在每次2折交叉验证之前随机将数据打乱，使得5次交叉验证中的数据划分不重复。

5. MCNemar检验

McNemar主要用于二分类问题，是用于比较两个学习器的性能大小

在这里插入图片描述

6.Friedman检验和Nemenyi后续检验

在这里插入图片描述

Friedman检验：
Nemenyi后续检验：

1.上式中，k为算法个数，N为数据集个数，qa值查表得到

关注

1
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
三、比较检验

文章目录一、概述二、具体检验方法1. 估计假设精度2. 采样理论基础3. 多次训练/测试的检验 - t检验4. 交叉验证t检验1. 基本思路5. MCNemar检验6.Friedman检验和Nemenyi后续检验一、概述比较检验的重要方法是统计假设检验，它为我们进行学习器性能比较提供了重要依据。统计假设检验：假设检验步骤：带入机器学习：二、具体检验方法1. 估计假设精度区分两种错误率：errors（h）在何种程度上提供了对errorD(h)的估计？2. 采样理
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。