![d8ad7095d3e53785b064932f19c4f3e6.png](https://img-blog.csdnimg.cn/img_convert/d8ad7095d3e53785b064932f19c4f3e6.png)
一、概述
在机器学习模型搭建好之后,需要对模型进行评估,针对不同的算法模型有不同的评估方法,比如:分类算法、回归算法、聚类算法等,本文主要是针对分类算法的模型评估方法进行总结整理,便于自己对评估方法的进一步理解和随时查阅。
二、详细说明
在介绍分类评估方法之前,首先介绍一个比较重要的概念:混淆矩阵,后续的评估方法都是在此基础之上定义的,对于分类模型而言(这里仅以最简单的二分类为例,假设只有0和1两类),其结果主要有以下四种:
- 实际为正、结果为正,预测正确
- 实际为正、结果为负,预测错误
- 实际为负、结果为正,预测错误
- 实际为负、结果为负,预测正确
混淆矩阵的形式,具体如下图所示:
![34559d8e7c0e57588caf10710a545272.png](https://img-blog.csdnimg.cn/img_convert/34559d8e7c0e57588caf10710a545272.png)
其中:T、F表示预测结果是否正确、而后面跟的P、N主要是对应预测的结果,这下记住上面的图了吧!
介绍完混淆矩阵,接下来我们介绍常用的评价标准,主要包括:准确率、精确率、召回率、F1值、ROC曲线、AUC、P-R、KS曲线等
准确率
准确率很好理解,就是预测正确的占比,其公式为:
精确率
也称为查准率,在真实值为正的样本中,预测正确的样本占比,其计算公式表示为