统计检验【二】

白小沫

于 2023-03-09 11:38:49 发布

阅读量587

点赞数 2

分类专栏：笔记文章标签：排序算法算法

本文链接：https://blog.csdn.net/m0_49354332/article/details/129418835

版权

笔记专栏收录该内容

17 篇文章 1 订阅

订阅专栏

Friedman检验和后续检验的全过程
1.计算平均序值-根据各项评价指标来排序，比如汉明损失，该值越低越好，所以如果值越低，就标注1，按照升序来依次排序，1，2，3，4，5，6，7，8，9。如果发现在某个数据集上的两个算法的性能结果一致，那么就对它们的序值进行平分，比如在数据集langlog上，存在两个算法的序值都为6.5，这是因为进行排序时，它们原本的位置应该是6和7，但由于两者性能相同，因此这里，对它们进行了平均处理，即6+7=13，13/2=6.5，然后表格中的每一列的所有序值进行相加，除以数据集个数，就可以得到平均序值了，比如第一列的平均序值计算如下：(1+4+7+1+1+1+1+1+1+6+1.5+1+1+1+1)/15=1.9667；再比如对于评价指标F1来说，值越大代表算法的性能越好，所以最大的值排序1，其他的按照降序来进行排序，剩下的步骤同上述一样。
在这里插入图片描述

2.这个表格是对之前计算各个算法的平均序值的一个总结

3.利用以下公式计算FF值和Critical value【α = 0.05】的值

这里K=9，N=15,服从自由度为K-1=8,N-1=14，【K-1=8】*【N-1=14】=112的分布，值可以通过查表得到。下面是部分表格内的值
在这里插入图片描述
根据上面的公式计算和查表就可以得到下面这张表格的内容了

在这里插入图片描述
可以发现FF的值比Critical value值大很多，所以拒绝H0原假设：at the significance level α = 0.05, the null hypothesis is rejected (this hypothesis denotes all compared methods have the same performance.).
采用后续检验，Nemenyi Test检验或者Bonferroni-Dunn test检验，找到对应K=9的值，如下表：