西瓜书课后笔记---实验评估方法与性能度量

最新推荐文章于 2022-10-11 16:27:52 发布

用户昵称就是没有昵称

最新推荐文章于 2022-10-11 16:27:52 发布

阅读量347

点赞数

文章标签：机器学习 python 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46582876/article/details/123505719

版权

模型评估与选择

错误率与精确率训练误差与泛化误差训练误差低≠泛化误差低⟹ 欠拟合(训练的不够)与过拟合(训练的太好NP≠P)

评估方法：通过与训练集数据不同的验证集来进行评估

1)留出法: 直接将数据集分割为训练集和验证集，常选用2/3~4/5作为训练集

2)交叉验证法：将数据集分成k个互斥的子集，每次选取其中一个作为验证集，其他的作为训练集，最终取k个分组的测试结果的平均值

3)自助法:每次从数据集D中随机抽取一个样本放入D1 中，然后放回数据集D，如此重复m次，数据集样本中始终不会被取到的概率是1/e。

2.性能度量衡量模型泛化能力的标准

回归任务中最常用的就是均方误差:

E(f;D)=

2

1)分类任务常用的是错误率和精确率：

2)(需求：比如信息检索领域，检测有多少比例的信息是用户感兴趣的)

真实

预测

正例

负例

正例

TP

FP

负例

FN

TN

PR曲线说明，查准率与查全率往往是矛盾的，不能兼得。如果一条曲线包裹中另外一条则该曲线对应的学习器优于另一个(比如A,B优于C)。对于相交的曲线可以用平衡点(BEP)来衡量，如图A优于B

BEP比较简单，往往不能满足需求，还有F1，F1一般化Fβ(对于查准率与查全率的偏重不同)。

多分类问题：n个二分类混淆矩阵中衡量查准率、查全率、F1

宏查准率(分别求每个混淆矩阵P然后求平均值)：

宏查全率(分别求每个混淆矩阵R然后求平均值)：

微查准率(对混淆矩阵的每个对应元素求平均，然后算P)：

微查全率(对混淆矩阵的每个对应元素求平均，然后算R)：

ROC与AUC (排序质量的好坏反映了学习器对于一般情况下泛化性能的好坏，ROC从该角度出发)

点(0，1)为理想模型，对角线为随机模型。如果要衡量两条相加曲线学习器优劣，可以计算阴影面积AUC。

AUC计算公式:

排序损失定义（曲线上方面积）：

4)代价敏感错误率与代价敏感曲线(不同类型预测错误产生后果不同)

在非均等代价下，ROC曲线不能反映出学习器好坏，但是代价曲线可以实现。

横轴为正例概率代价(p是样例为正例的概率)：

纵轴为归一化代价(FNR=1-TPR)：

代价曲线：

用户昵称就是没有昵称

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
西瓜书课后笔记---实验评估方法与性能度量

模型评估与选择错误率与精确率训练误差与泛化误差训练误差低≠泛化误差低⟹ 欠拟合(训练的不够)与过拟合(训练的太好NP≠P)评估方法：通过与训练集数据不同的验证集来进行评估1)留出法: 直接将数据集分割为训练集和验证集，常选用2/3~4/5作为训练集2)交叉验证法：将数据集分成k个互斥的子集，每次选取其中一个作为验证集，其他的作为训练集，最终取k个分组的测试结果的平均值3)自助法:每次从数据集D中随机抽取一个样本放入D1 中，然后放回数据集D，如此重复m次，数据集样本中始终不会被取到的概率
复制链接

扫一扫

用户昵称就是没有昵称 CSDN认证博客专家 CSDN认证企业博客

码龄4年

10: 原创

28万+: 周排名

9万+: 总排名

1万+: 访问

: 等级

182: 积分

65: 粉丝

81: 获赞

2: 评论

70: 收藏

私信

关注

热门文章

最新评论

Amazon CodeWhisperer 体验分享
CSDN-Ada助手: 恭喜作者分享了关于“Amazon CodeWhisperer”的体验分享，阅读了你的博客后，我对这个主题有了更深入的了解。希望你能继续坚持写作，分享更多有价值的内容给读者。或许下一步可以考虑深入挖掘一些实际案例，或者结合个人经历来进行更深入的分析和分享。期待你更多的精彩作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
华为送Mate60pro活动来了！
CSDN-Ada助手: 评论：非常高兴看到你写了第二篇博客！继续加油，坚持写作是非常有益的。关于华为送Mate60pro活动，我觉得这是一个非常吸引人的活动，大家都应该积极参与。除此之外，还有一些和该博文相关的扩展知识和技能，可以进一步丰富你的内容。比如，你可以介绍一下华为Mate60pro的主要特点和性能，让读者更加了解这款手机的优势；或者你可以分析一下华为近年来在手机市场上的发展趋势，以及它如何赢得消费者的信任。同时，你也可以分享一些关于手机抽奖活动的注意事项和技巧，帮助读者增加中奖的机会。希望我的建议对你有所帮助，期待看到更多精彩的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。