衡量分类算法的几个指标

最新推荐文章于 2023-11-24 12:21:49 发布

李远李远啊

最新推荐文章于 2023-11-24 12:21:49 发布

阅读量1.5k

点赞数 2

分类专栏：在校生文章标签：机器学习分类算法指标

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39567819/article/details/86530852

版权

在校生专栏收录该内容

8 篇文章 0 订阅

订阅专栏

机器学习算法的指标首要是准确度，对于不平衡数据，准确度这个指标显然是不够的，比如数据比例为1000:10.

算法对大样本类（样本多的那一类）分类全部正确，对小样本类分类全部错误，准确度也高达（1000）/1010=99%。

所以对于不平衡数据，引入了几种不同的指标：

本文也使用了其它一些
真正率(TPR , TruePositive Rate)，或称灵敏度(Sensitivity)、召回率(Recall)等；
真负率(TNR,True Negative Rate)，或称特指度(Specificity)
F-measure以及G-mean等

首先设置以下几个指标：

TＰ（正确预测的正样本数）FN （错误预测的正样本数）
ＦＰ（错误预测的负样本数）ＴＮ（正确预测的负样本数）

Ａｃｃ＝（ＴＰ＋ＴＮ）/(ＴＰ＋ＴＮ＋ＦＰ＋ＦＮ)
ＴＰＲ＝Ｓｅｎｓｉｔｉｖｉｔｙ＝Ｒｅｃａｌｌ＝ＴＰ/(ＴＰ＋ＦＮ)
ＴＮＲ＝Ｓｐｅｃｉｆｉｃｉｔｙ＝ＴＮ/(ＴＮ＋ＦＰ)
Ｐｒｅｃｉｓｉｏｎ＝ＴＰ/(ＴＰ＋ＦＰ)
Ｆ－ｍｅａｓｕｒｅ＝２＊Ｐｒｅｃｉｓｉｏｎ＊Ｒｅｃａｌｌ(Ｐｒｅｃｉｓｉｏｎ＋Ｒｅｃａｌｌ)
Ｇ－ｍｅａｎ＝ sqrt(ＴＰＲ × ＴＮＲ)

实际做实验的时候，可能出现分母为零而程序出错无法运行的情况，所以在Ｐｒｅｃｉｓｉｏｎ=ＴＰ/(ＴＰ＋ＦＰ)的分母上加一个极小的数（如1e-5），由于TP=0，对实验结果没有影响。如果TP=FP=0，就是正类全部分错，负类全部分对，就会这样。

ＴＰ/(ＴＰ＋ＦＮ) ＴＮ/(ＴＮ＋ＦＰ)两个数，如果测试集中恰好没有正类，或没有负类，也会分母为零导致程序运算错误。

这时候应该注意一下测试集的选取，可以考虑现将数据按照类别分开，然后抽取数据集。

李远李远啊

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。