分类算法评估-混淆矩阵、精确率和召回率
- 首先引入问题,为什么我们再评估分类算法的时候通常用精确率和召回率?
假设现在有1000个人。预测他们是否得了癌症。假设他们总共有900人是健康的,10人患癌症,那么在这种情况下我们如果将所有人都预测为健康的。
在这种情况下我们的准确率是: 99.0% 那我们的这个模型显然的不是一个好的模型。
所以就引出了精确率(precision)和召回率(recall)
先来看一个混淆矩阵
这里的T就是True,F就是False,P就是Positive(阳性),N就是Negative(阴性)
TN代表的意思也就是:预测的是0 实际也是0
FP代表的意思也就是:预测的是1 实际是0
FN代表的意思也就是:预测的是0 实际是1
TP代表的意思也就是:预测的是1 实际上也是1
然后我们的求精准率的公式就有了 ↓↓↓
精准率公式:
–
召回率公式:
文字表达就是**?*
精确率 = 判断为1实际为1 跟 所有预测为1的比例
召回率 = 判断为1实际为1 跟 所有实际为1的比例
这就是精确率和召回率了。其实在不同的情况下所注重的不同,在某些问题上注重精确率,在某些问题上注重召回率。
还有一个评估方法结合了精确率和召回率,那就是F1_Score,
F1_Score将精确率和召回率都兼顾了,也就是求了精确率和召回率的调和平均值。
F1_Score的公式为:
原 创