一份非常全面的机器学习分类与回归算法的评估指标汇总

最新推荐文章于 2023-06-08 16:22:50 发布

Wang | AI派

最新推荐文章于 2023-06-08 16:22:50 发布

阅读量943

点赞数

分类专栏：机器学习文章标签： ROC AUC 分类问题评估指标回归问题评估指标

本文链接：https://blog.csdn.net/im_wv/article/details/90247658

版权

本文介绍了机器学习中评估模型性能的指标，包括分类和回归问题。分类指标涉及准确率、精确率、召回率、F1值、混淆矩阵及ROC曲线和AUC。回归指标涵盖平均绝对误差、均方误差、平均绝对百分误差和均方根误差。通过这些指标，可以帮助比较和选择最佳模型。

摘要由CSDN通过智能技术生成

本文是《机器学习宝典》第 3 篇，读完本文你能够掌握分类与回归算法的评估指标。

读完机器学习算法常识之后，你已经知道了什么是欠拟合和过拟合、偏差和方差以及贝叶斯误差。在这篇给大家介绍一些机器学习中离线评估模型性能的一些指标。

当我们训练得到了多个模型之后，如何衡量这几个模型的性能呢？也就是说我们需要一个能够衡量模型“好坏”的标准，我们称之为评估指标。在对比不同的模型效果时，使用不同的评估指标往往会导致不同的结论，这也就是说模型的效果好坏是相对的。

针对不同类型的学习任务，我们有不同的评估指标，这里我们来介绍最常见的分类与回归算法的一些评估指标。

分类指标

生活中大多数的分类问题都属于二分类问题，所以这里以二分类为例，来说明下分类相关的一些指标。

正式介绍指标之前，先来普及一些基本概念：有时候“阳性”、“真”、“正类”、“1” 指的是一回事，“阴性”、“假”、“负类”、“0”指的也是一回事。例如模型对这个样本的预测结果为 1，可以认为模型对这个样本的预测结果为真、或者为正类、或者为阳性，其实说的都是一个意思。

混淆矩阵

混淆矩阵（confusion matrix）是一个评估分类问题常用的工具，对于 k 元分类，其实它就是一个k x k的表格，用来记录分类器的预测结果。对于常见的二分类，它的混淆矩阵是 2x2 的。

在二分类中，可以将样本根据其真实结果和模型的预测结果的组合划分为真阳性（true positive，TP）、真阴性（true negative，TN）、假阳性（false positive，FP）、假阴性（false negative，FN）。根据 TP、TN、FP、FN 即可得到二分类的混淆矩阵。

准确度

准确率（accuracy）是指模型预测正确（包括预测为真正确和预测为假正确）的样本数量占总样本数量的比例，即

其中，

表示模型正确分类的样本个数，

表示所有的样本个数。

在二分类中，准确率可以通过下面的计算公式得到。

准确率是分类问题中的一个最简单也最直观的评估指标，但是准确率存在一些局限性。比如，在二分类中，当负样本占比 99 %时，如果模型把所有样本都预测为负样本也能获得 99% 的准确率。虽然准确率看起来很高，但是其实这个模型时没有用，因为它找不出一个正样本。

最低0.47元/天解锁文章

Wang | AI派

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
一份非常全面的机器学习分类与回归算法的评估指标汇总

本文是《机器学习宝典》第 3 篇，读完本文你能够掌握分类与回归算法的评估指标。读完机器学习算法常识之后，你已经知道了什么是欠拟合和过拟合、偏差和方差以及贝叶斯误差。在这篇给大家介绍一些机器学习中离线评估模型性能的一些指标。当我们训练得到了多个模型之后，如何衡量这几个模型的性能呢？也就是说我们需要一个能够衡量模型“好坏”的标准，我们称之为评估指标。在对比不同的模型效果时，使用不同的评估指标往...
复制链接

扫一扫