机器学习-周志华学习笔记

最新推荐文章于 2023-07-17 21:58:17 发布

Autopilot

最新推荐文章于 2023-07-17 21:58:17 发布

阅读量467

点赞数

分类专栏：机器学习文章标签：机器学习周志华西瓜书

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Autopilot/article/details/89339456

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1.模型评估
在样本数为m时，既要进行训练，又要进行测试的解决方案。
1.1留出法：
将原先数据集按照一定的比例划分成训练集和测试集，常见的为2/3,4/5。
优化：可进行若干次随机划分，独立同分布进行分层采样，进行评估后取其平均值。
1.2交叉验证法：
将数据集划分成K个大小相似且互斥的子集，用K-1的子集进行训练，剩下的当做测试集。进行K次训练
当K为样本数时，称为‘留一法’，优点：结果较为准备。缺点：训练时长过长。
1.3自助采样法
进行m次随机从样本中选择一个样本加入到训练集D’中，然后将该样本放回原先数据集，最后将未出现在训练集中的样本当做测试集使用。
经过调参之后获得的较优模型，记录此时的算法及参数，用原先的数据集再次进行训练。
2.模型性能度量
2.1错误率
2.2正确率
2.3查准率：选出来的有多少是正确的（P）
2.4查全率：选出来的占所有正确的比例（R）
可通过P-R曲线对比模型好坏
若A曲线包括B曲线，则认为A的性能更好
根据平衡点进行判断
根据面积进行判读
根据需求进行判断
2.5ROC曲线
对预测的样本置信度进行排序
TP真正例 FN假反例
FP假正例 TN真反例
纵轴：真正例率 TPR: TP/(TP+FN) P
横轴：假正例率 FPR: FP/(FP+TN) 1-P
3.代价敏感矩阵

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。