机器学习(七)分类模型的评估
实际上,在学习k-近邻算法,以及朴素贝叶斯算法的的时候,我们在代码里面已经运用到了相关方法:
estimator.score() #一般最常见使用的是准确率,即预测结果正确的百分比
那么,他的底层原理大概是什么样子的呢?
一.混淆矩阵
1.1 什么是混淆矩阵
在分类任务下,预测结果(Predicted Condition)与正确标记(True Condition)之间存在四种不同的组合,构成混淆矩阵(适用于多分类)
什么意思呢?
我们举一个例子,先看“真实结果”,我们假设正例为“是猫”,则假例便是“非猫”
再看横轴,即:“预测结果”。如果预测的结果是“猫”,那么这就是横轴的正例,如果预测结果不是猫,那么就是横轴的假例
如果预测的结果是猫,且测试的对象,确实就是一只猫,那么就是