机器学习模型评估中的常用指标

一个比较推荐的解决机器学习问题的步骤是:首先以一个简易的算法开始,快速的进行实现,并在交叉验证集上进行验证;然后画出它的学习曲线,通过学习曲线确定是否更多的数据或者更多的特征会对模型的优化有帮助。接着人为地检测交叉验证集中被错误的进行分类的或者预测的样本的共同特征,从实际入手对模型进行调整,即Error Analysis,不断调整并验证在交叉验证集上的误差,寻找最优的结果,优化模型。

在机器学习中,当完成了一个模型的训练后,如何对当前模型的优劣程度做一个评估呢?下面就需要一些业界公认的指标来对模型进行评估。

首先从一个例子开始:对于一个分布非常不均匀的数据集(skewed class),比如正样本(y=1)占比为1%,负样本(y=0)占比为99%,如果此时采用正确率来进行模型优劣的估计,那么如果采用比如逻辑回归等常见分类算法,可能达到98%的正确率。但是如果设计一个“模型”,始终预测结果为负样本,那么这个模型的正确率能够达到99%,从这个指标来看它甚至比经过机器学习算法学习得到的模型表现还好。但是一个显而易见的事实是这个简单的“模型”在测试集上具有非常不佳的表现,因为它本质上并没有进行预测。因此需要别的一些参数来进行模型评估。

下图是常见指标组成的混淆矩阵,其中Actual class代表样本实际应该所处的分类,Predicted class代表模型预测的结果。


根据上面的混淆矩阵,有了下面几个指标的定义:

Precision = (True Positive)/(True Positive + False Positive)

Recall = (True Positive)/(True Positive + False Negative)

F1 score = 2 * (Precision * Recall)/(Precision + Recall)

Precision和Recall二者都很高,则表明这个模型非常好。需要注意的是,对于一个分类模型往往我们都会设置一个阈值threshold;大于这个阈值分类为正样本,小于这个阈值分类为负样本,阈值的确定往往也对应着不同的Precision和Recall。一般来说默认的阈值我0.5,当我们降低threshold时,Precision会变小,Recall会变大;当增大threshold时,Precision会变大,Recall会变小。那么应该如何权衡一个最优的Precision和Recall,来作为最优的模型指标呢?

这时引入了F1 score这个指标,它的公式如上面所示,当Precision或者Recall都非常小的时候,F1 score都会非常小,只有当Precision和Recall都为一个比较高的水平的时候,才可以得到一个比较高的F1 score。

机器学习模型的评估指标主要分为分类和回归两大类。在分类模型常用的评估指标包括混淆矩阵、准确率、错误率、精确率、召回率、F1 score、ROC曲线、AUC、PR曲线、对数损失和分类指标的文本报告。而在回归模型常用的评估指标包括平均绝对误差(MAE)、均方误差(MSE)、均方根误差(RMSE)、归一化均方根误差(NRMSE)和决定系数(R2)。\[3\] 其,ROC曲线是一种常用的评估分类模型性能的指标,它独立于responders比例的变化,可以帮助我们了解模型在不同阈值下的表现。\[1\]而MAE(平均绝对误差)是一种常用的评估回归模型性能的指标,它衡量了预测值与真实值之间的平均绝对差异。\[2\] 综上所述,机器学习模型的评估指标根据不同的任务和模型类型选择不同的指标进行评估,以帮助我们了解模型的性能和效果。 #### 引用[.reference_title] - *1* [你知道这11个重要的机器学习模型评估指标吗?](https://blog.csdn.net/fendouaini/article/details/100013633)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [机器学习模型评估指标](https://blog.csdn.net/dfly_zx/article/details/123142984)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值