实验测试方法
在对模型评估的时候我们一般就考虑准确率,但是要与其他模型对比效果,仅作准确率的比较是不够的。
还需要验证这些模型的差异是否具有统计学意义,也就是判断结果真实程度的一种估计方法。
Friedman test
friedman test是一个非参数实验,假设有8个算法在14个数据集上,得到下表的结果:
将这八个算法的平均名次记为 R 1 , R 2 , R 3 , R 4 , R 5 , R 6 , R 7 , R 8 R_1, R_2, R_3, R_4, R_5, R_6, R_7, R_8 R1,R2,R3,R4,R5,R6,R7,R8, 原假设认为算法性能没有差异,然后通过以下的公式计算检验值,
X 2 = 12 N