文章目录
问题:在存在极度偏斜的数据中,应用分类准确度来评价分类算法的好坏是远远不够的。
eg:如果癌症的产生概率只有0.1%,那么系统只要预测所有人都是健康的就可以达到99.9%的准确率,因此虽然准确率很高,但是预测系统实际上没有发挥什么作用。
混淆矩阵
precision recall
召回率(recall):
r e c a l l = T P T P + F N recall=\frac{T P}{T P+F N} recall=TP+FNTP
精准率(precision):
p r e c i s i o n = T P T P + F P precision=\frac{TP}{T P+F P} precision=TP+FPTP
F1 Score
1 F 1 = 1 2 ( 1 precision + 1 recall ) \frac{1}{F 1}=\frac{1}{2}\left(\frac{1}{\text {precision}}+\frac{1}{\text {recall}}\right) F11=2