吃瓜笔记task1

小龙虾cary

已于 2022-07-25 00:43:13 修改

阅读量224

点赞数

文章标签：机器学习人工智能

于 2022-07-12 14:48:52 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44079555/article/details/125742979

版权

第一章：绪论

第二章：模型评估与选择

留出法：

训练/测试集的划分要尽可能保持数据分布的一致性，避免因数据划分过程引入额外的偏差而对最终结果产生影响

交叉验证法

在这里插入图片描述

留一法

训练集与初始数据集相比只少了一个样本

自助法

有放回的采样

性能度量

回归任务常用——均方误差

分类任务中的性能度量

二分类

精度acc

分类正确的样本数占样本总数的比例

注意点：在数据严重不平衡的情况下使用该指标不合理

错误率 = 1 - acc

查准率

选的尽可能对
$\frac{TP}{TP+FP}$

查全率

选的尽可能全
$\frac{TP}{TP+FN}$

F1

基于查准率与查全率的调和平均
$F_1 = \frac{2\times TP}{P+R} = \frac{2\times TP}{样例总数+TP-TN}$

多分类

宏查准、宏查全、宏F1

分成N个二分类后分别计算P、R、F1再求平均

微查准、微查全、微F1

分成N个二分类后对TP、FP、TN、FN均值后计算P、R、F1

ROC与AUC

真正例率（TPR）——ROC横轴

$\frac{TP}{TP+FN}$

假正例率（FPR）——ROC纵轴

$\frac{FP}{TN+FP}$

ROC

ROC 曲线可以直观的反应模型性能，但是难以比较不同模型的差异。

AUC

$\frac{FP}{TN+FP}$

ROC

ROC 曲线可以直观的反应模型性能，但是难以比较不同模型的差异。

AUC

ROC曲线的下方的面积大小，可以实现对模型性能的定量化描述

参考

周志华，机器学习，清华大学出版社，2016
https://www.bilibili.com/video/BV1Mh411e7VU?p=6&spm_id_from=333.1007.top_right_bar_window_history.content.click&vd_source=ae6a9270751fdffac8724e71e288e0ec
《机器学习公式详解》

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。