机器学习中常用的性能度量—— ROC 和 AUC

最新推荐文章于 2024-07-24 19:56:38 发布

沉住气CD

最新推荐文章于 2024-07-24 19:56:38 发布

阅读量1.7k

点赞数 25

分类专栏：机器学习常用算法文章标签：机器学习人工智能 python 数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/PyDarren/article/details/136026002

版权

什么是泛化能力？

通常我们用泛化能力来评判一个模型的好坏，通俗的说，泛化能力是指一个机器学期算法对新样本（即模型没有见过的样本）的举一反三的能力，也就是学以致用的能力。

举个例子，高三的学生在高考前大量的刷各种习题，像五年高考三年模拟、三年高考五年模拟之类的，目的就是为了在高考时拿到一个好的分数，高考的题目就是新题，一般谁也没做过，平时的刷题就是为了掌握试题的规律，能够举一反三、学以致用，这样面对新的题目也能从容应对。这种规律的掌握便是泛化能力，有的同学很聪明，考上名校，很大程度上是该同学的泛化能力好。

在机器学习中，对于分类和回归两类监督学习，分别有各自的评判标准，这里我们讨论常用于分类任务的性能度量标准——AUC 和 ROC。

几个重要概念：混淆矩阵、准确率、精准率和召回率

1. 混淆矩阵

假设我们建立的是二分类模型，将实际类别和预测类别进行两两组合，就形成了混淆矩阵。

真实情况		预测结果
	正例	反例
正例	TP（真正例）	FN（假反例）
反例	FP（假正例）	TN（真反例）

接下来的性能度量指标都是由混淆矩阵的各个元素计算得来。

2. 准确率

$准确率=\frac{TP+TN}{TP+TN+FP+FN}$

最低0.47元/天解锁文章

博客等级

码龄7年

110
原创

700
点赞

1319
收藏

547
粉丝

关注

私信

分类专栏

工程开发 2篇
数据可视化 5篇
PyTorch 5篇
机器学习常用算法 11篇
NLP 3篇
统计学 12篇
python学习 17篇
R学习 11篇
数据库 7篇
爬虫 3篇
数据结构 19篇
深度学习 5篇

展开全部收起

上一篇：: Flask 之 SQLAlchemy

下一篇：: 时间序列之趋势

最新评论

统计学之基础知识（数据分析准备）
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
利用R语言进行基本数据管理
沉住气CD: 强推ggplot2
R语言高级数据管理
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)提升标题与正文的相关性；(3)使用更多的站内链接。
利用R语言进行基本数据管理
CSDN-Ada助手: R语言中的数据可视化库有哪些？
利用R语言的dplyr包进行数据转换
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加除了各种控件外，文章正文的字数；(3)提升标题与正文的相关性。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。