评价指标1
以下四个可以这样理解,第一个字母代表你预测的对错T/F,第二个字母代表你预测的是正还是负P/N。例如TP=你预测的是正的,且预测对了。
真正例/真阳性(TP):预测为正,实际为正,预测对了。
真负例/真阴性(TN):预测为负,实际为负,预测对了。
假正例/假阳性(FP):预测为正,实际为负,预测错了。
假负例/假阴性(FN):预测为负,实际为正,预测错了。
所谓正负指的是,对某一类,你认为它是这一类或不是,也就是说每一类都需要计算一遍这四个指标。
例子
比如三类问题
你预测的:
1 | 2 | 3 | 1 | 2 | 3 | 1 | 2 | 3 | 1 |
---|
实际分类:
1 | 1 | 2 | 2 | 2 | 3 | 3 | 3 | 3 | 3 |
---|
对于1类:
TP = 1, TN = 5, FP = 3, FN = 1
对于其它两类同理
评价指标2
准确率(accuracy):(TP + TN) / (TP + TN + FP + FN),分母就是你预测的全部数据P’+N’
精准率(precision):TP / (TP + FP),分母就是你预测的全部正数据P’
召回率(recall):TP / P,真实数据中全部正数据
其中P’和N’表示你预测的正负类,P和N表示真实正负类。往往预测数据与真实数据数量相等,P’和P不需要区分,但如果预测数量与真实数量不等,则需要区分。
例子
接着上面的例子:
总的准确率:
accuracy = 4 / 10 = 0.4
对于1类:
precision = 1 / (1 + 3) = 0.25
recall = 1 / 2 = 0.5
其余两类同理
混淆矩阵
就是把上面几个值组合一下显示到矩阵中
真实\预测 | 正 | 负 | 合计 |
---|---|---|---|
正 | TP | FN | P |