机器学习笔记4-评估指标

最新推荐文章于 2021-12-01 17:28:56 发布

handsome_happy

最新推荐文章于 2021-12-01 17:28:56 发布

阅读量522

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_32201847/article/details/68952917

版权

机器学习专栏收录该内容

32 篇文章 1 订阅

订阅专栏

对于分类，我们会探讨准确率、精确率、召回率和 F 分数。对于回归，我们会探讨平均绝对误差和均方误差。

分类指标

混淆矩阵

如有150个样本数据，这些数据分成3类，每类50个。分类结束后得到的混淆矩阵为：

		预测
		类1	类2	类3
实际	类1	43	5	2
	类2	2	45	3
	类3	0	1	49

每一行之和为50，表示50个样本，
第一行说明类1的50个样本有43个分类正确，5个错分为类2，2个错分为类3

查全率=预测准确的个数/该行实际数和
查准率=预测准确的个数/该列预测数和

F1 = 2 * (查准率 *查全率) / (查准率 +查全率)

回归指标

平均绝对误差

您可能已回想起，在统计学中可以使用绝对误差来测量误差，以找出预测值与真实值之间的差距。平均绝对误差的计算方法是，将各个样本的绝对误差汇总，然后根据数据点数量求出平均误差。通过将模型的所有绝对值加起来，可以避免因预测值比真实值过高或过低而抵销误差，并能获得用于评估模型的整体误差指标。

均方误差

均方误差是另一个经常用于测量模型性能的指标。与绝对误差相比，残差（预测值与真实值的差值）被求平方。
对残差求平方的一些好处是，自动将所有误差转换为正数、注重较大的误差而不是较小的误差以及在微积分中是可微的（可让我们找到最小值和最大值）。

回归分数函数

除了误差指标之外，scikit-learn还包括了两个分数指标，范围通常从0到1，值0为坏，而值1为最好的表现。
虽然在课程最后的项目中，我们不会用到这两个指标，但是需要知道他们很重要。他们还有一个优点，就是看起来和分类指标类似，都是数字越接近1.0分数就越好。
其中之一是R2分数，用来计算真值预测的可决系数。在 scikit-learn 里，这也是回归学习器默认的分数方法。
另一个是可释方差分数
虽然眼下我们不会详细探讨这些指标，一个要记住的重点是，回归的默认指标是“分数越高越好”；即，越高的分数表明越好的表现。

handsome_happy

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习笔记4-评估指标

对于分类，我们会探讨准确率、精确率、召回率和 F 分数。对于回归，我们会探讨平均绝对误差和均方误差。分类指标混淆矩阵如有150个样本数据，这些数据分成3类，每类50个。分类结束后得到的混淆矩阵为：　　预测类1类2类3实际　　类143
复制链接

扫一扫