混淆矩阵、精确率
以上两种衡量指标是针对二元分类器
准确率(), 精确率(Precision), 召回率(Recall)和
一、分类精准度的缺陷
1)评论算法的好坏
- 回归问题:MSE、MAE、RMSE、R^2(以为最好的标准);
- 分类问题:分类准确度(score() 函数);
- 分类算法的评价要比回归算法的评价标准复杂的多;
- 评论分类算法好坏的指标,有多种,具体选择评价指标时要根据数据和应用场景而定;
2)分类准确度类评价分类算法的好坏存在问题
- 实例说明
- 任务:搭建一个癌症预测系统,输入一个人体检的信息指标,可以判断此人是否有癌症;
- 思路:收集大量的数据,训练机器学习算法模型,进而完成癌症预测系统;
- 疑问:如果该系统的预测准确度为 99.9% ,该系统是好?是坏?
- 情景1:如果该种癌症在人群中产生的概率只有 0.1%,那么即使随便一个系统,预测所有人都是健康,该系统也可达到 99.9% 的准确率