Ds_fz-CSDN博客

原创周志华机器学习西瓜书学习笔记（二）下 | 第二章：模型评估与选择

首先，使用留出法或交叉验证法得到每个算法在每个数据集上的测试结果，然后在每个数据集上根据测试性能由好到坏排序，并赋予序值1,2,..;例如，在D₁和D₃上，A最好、B其次、C最差，而在D₂上，A最好、B与C性能相同，……对二分类问题，使用留出法不仅可估计出学习器A和B的测试错误率，还可获得两学习器分类结果的差别，即两者都正确、都错误、一个正确另一个错误的样本数，如；时，不能拒绝假设，即认为两学习器的性能没有显著差别。表示第 i个算法的平均序值，为简化讨论，暂不考虑平分序值的情况，则。

2024-08-30 22:00:18 910

原创周志华机器学习西瓜书学习笔记（二）上 | 第二章：模型评估与选择

在进行比较时，若一个学习器的P-R曲线被另一个学习器的曲线完全“包住”,则可断言后者的性能优于前者，例如图2.3中学习器A的性能优于学习器C;在很多情形下，我们可根据学习器的预测结果对样例进行排序，排在前面的是学习器认为“最可能”是正例的样本，排在最后的则是学习器认为“最不可能”是正例的样本，按此顺序逐个把样本作为正例进行预测，则每次可以计算出当前的查全率、查准率，以查准率为纵轴、查全率为横轴作图，就得到了查准率-查全率曲线，简称“P-R曲线”,显示该曲线的图称为“P-R图”这样的测试结果，亦称。

2024-08-29 22:42:35 1382

原创周志华机器学习西瓜书学习笔记（一）| 第一章绪论

注：Mitchell在1997年给出了一个更形式化的定义：假设用P评估计算机程序在某任务类T上的性能，若一个程序通过利用经验E在T中任务上获得了性能改善，我们则说关于T和P，该程序对E进行了学习。如果没有偏好，学习算法产生的模型每次在进行预测时随机抽选训练集上的等效假设，那么对新示例学得模型时而告诉我们它是好的、时而告诉我们它是不好的，这样的学习结果显然没有意义。的过程，搜索目标是找到与训练集“匹配”(fit)的假设，即能够将训练集中的对象判断正确的假设。要谈论算法的相对优劣，必须要针对具体的学习问题。

2024-08-27 17:23:27 1115 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 周志华机器学习西瓜书学习笔记（二）下 | 第二章 ：模型评估与选择

原创 周志华机器学习西瓜书学习笔记（二）上 | 第二章：模型评估与选择

原创 周志华机器学习西瓜书学习笔记（一）| 第一章 绪论

空空如也

空空如也

原创周志华机器学习西瓜书学习笔记（二）下 | 第二章：模型评估与选择

原创周志华机器学习西瓜书学习笔记（二）上 | 第二章：模型评估与选择

原创周志华机器学习西瓜书学习笔记（一）| 第一章绪论