15 机器学习模型评估指标--机器学习基础理论入门

最新推荐文章于 2023-10-17 08:05:33 发布

chen_冲冲

最新推荐文章于 2023-10-17 08:05:33 发布

阅读量393

点赞数 1

分类专栏：机器学习基础理论入门文章标签：机器学习人工智能数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/q339179198/article/details/113779753

版权

机器学习基础理论入门专栏收录该内容

10 篇文章 2 订阅

订阅专栏

15 机器学习模型评估指标–机器学习基础理论入门

7.1 回归问题评估指标

绝对误差

绝对误差为预测点与真实点之间距离之差的绝对值的平均值，即：
在这里插入图片描述

均方误差

均方误差为预测点与实际点之间距离之差平方和的均值，即
在这里插入图片描述
因为绝对误差不是光滑的函数，所以一般都是使用均方误差作为回归问题的评估指标。

7.2 分类问题评估指标

分类问题结果类别：

混淆矩阵
在这里插入图片描述
TN：True negative真阴；FP：False positive假阳
FN：False negative假阴；TP：True positive真阳

1) 精准率（precision）

所有预测为正例的样本（TP+FP）中真正为正例的样本（TP）的比率，又叫查准率，即
在这里插入图片描述

2) 召回率（recall）

所有预测样本中真正为正例的样本（TP）与样本中实际正例（TP+TN）的比值，又叫查全率，即
在这里插入图片描述

3) F1_score值

查准率和查全率使一对相矛盾的量，一种综合指标使F1值，即
在这里插入图片描述

4) ROC曲线&AUC面积

在这里插入图片描述
ROC曲线评价学习器性能，检验分类器对客户进行正确排序的能力。
ROC曲线性质：如果一条曲线完全包裹另一条曲线，则外面曲线的性能更优。（ROC曲线下面的面积称为AUC area

ROC曲线举例
有如下10个样本数据，其实际类别已经给出，模型预测为正例（P）的概率已经给出，由此画出ROC曲线：
在这里插入图片描述

5）混淆矩阵

混淆矩阵（confusion matrix）是一种评价分类模型好坏的形象化展示工具。
如：有150个样本数据，这些数据分成3类，每类50个，预测后得到的混淆矩阵为：
在这里插入图片描述
从上可以看出：如果混淆矩阵中非对角线元素全为0，则表示是一个完美的分类器。

6）准确率（accuracy）

Accuracy=(TP+TN) / (TP+FP+TN+FN)
一般要0.8以上

7） KS曲线，KS值—学习器将正例和反例分开的能力，确定最好的“截断点”

KS曲线和ROC曲线都用到了TPR，FPR。
KS曲线是把TPR和FPR都作为纵坐标，而样本数作为横坐标

7.3 本章小结

知识点回顾
在这里插入图片描述
学习要求
（1）理解回归问题、分类问题对应评价指标的意义；
（2）掌握回归问题、分类问题和聚类问题对应评价指标的使用方法和应用范围；
（3）了解互相之间的区别和联系。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。