周志华《机器学习》课后习题解答系列（三）：Ch2 - 模型评估与选择

模型评估与选择

最新推荐文章于 2025-05-27 22:40:38 发布

原创最新推荐文章于 2025-05-27 22:40:38 发布 · 2.3w 阅读

83 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #周志华 #第二章 #模型评估与选择 #习题解答

机器学习专栏收录该内容

31 篇文章

订阅专栏

AI助手已提取文章相关产品：

本章概要

本章讲述了模型评估与选择（model evaluation and selection）的相关知识：

2.1 经验误差与过拟合（empirical error & overfitting）

精度accuracy、训练误差（经验误差）training error（empirical error）、泛化误差**generalization error、过拟合**overfitting、欠拟合underfitting；

2.2 模型评估方法（evaluate method）

测试误差testing error、留出法hold-out、分层采样stratified sampling、交叉验证法cross validation、k-折交叉验证**k-fold cross validation、留一法leave-one-out（LOO）、自助法bootstrapping、自助采样bootstrap sampling、包外估计out-of-bag estimate、调参**parameter tuning、验证集validation set；

2.3 模型性能度量（performance measure）

错误率error rate、查准率（准确率）precision、查全率（召回率）recall、P-R曲线、平衡点BEP、F1/Fβ、混淆矩阵、ROC曲线、AUC、代价敏感cost-sensitive、**代价矩阵**cost matrix、代价曲线cost curve、期望总体代价；

2.4 模型比较检验（comparation & testing）

假设检验hypothesis test、拒绝假设、t-检验t-test、Friedman检验、后续检验post-hoc test、Friedman检验图；

2.5 偏差与方差（bias & variance）

偏差-方差窘境bias-variance dilemma；

习题解答

2.1 分层抽样划分训练集与测试集

根据分层采样原则，共有方法：

这里写图片描述 .

2.2 留一法与k-折交叉验证法比较

因为测试集被划分到训练样本中多的类，设一共100个样本：

留一法：测试集1个样本，训练集99个样本且有50个与测试集真实类别不同，故测试集无法被划分到正确的类，错误率100%；

交叉验证法：在采用分层抽样的前提下，分类靠随机猜，错误率因为50%；

2.3 F1值与BEP的关联

首先给出度量定义：

BEP：是P-R曲线上的平衡点坐标值，BEP = P = R (即准确率 = 召回率)；
F1值：是P与R的调和平均，1/F1 = (1/P + 1/R) / 2;

所以 BEP = F1 (当P = R时) -> BEP(A) > BEP(B).

2.4 TPR、FPR、P、R之间的关联

给出混淆矩阵示例如下：

然后给出各度量的定义式：

详细解释是：

P，查准率（准确率），（预测正例）中（真实正例）的比例.
R，查全率（召回率），（真实正例）中（预测正例）的比例.
TPR，真正例率，（真实正例）中（预测正例）的比例，TPR = R.
FPR，假正例率，（真实反例）中（预测正例）的比例.

2.5 AUC推导（有限样例下）

直接给出大致思路如下图：

这里写图片描述

2.6 错误率与ROC曲线的关系

错误率可由代价-混淆矩阵得出；

ROC曲线基于TPR与FPR表示了模型在不同截断点取值下的泛化性能。

ROC曲线上的点越靠近（1，0）学习器越完美，但是常需要通过计算等错误率来实现P、R的折衷，而P、R则反映了我们所侧重部分的错误率。

2.7 ROC曲线与代价曲线的对应关系

ROC曲线的点对应了一对（TPR,FPR），即一对（FNR,FPR），由此可得一条代价线段（0,FPR)–(1,FNR），由所有代价线段构成簇，围取期望总体代价和它的边界–代价曲线。所以说，ROC对应了一条代价曲线，反之亦然。

2.8 ROC曲线与代价曲线的关系

比较见表：

Max-min	z-score
方法简单	计算量相对大一些
容易受高杠杆点和离群点影响	对离群点敏感度相对低一些
当加入新值超出当前最大最小范围时重新计算所有之前的结果	每加入新值都要重新计算所有之前结果

2.9 卡方检验过程

可直接参考：卡方检验 - 百度百科

您可能感兴趣的与本文相关内容

9 条评论

I am Link 2019.08.31
其实代价曲线并不能对应出唯一的ROC曲线。很多代价曲线可以有多条ROC曲线与之对应。

hhuc_hhb 2019.02.01
楼主你好呀，请问（2.22）的证明中为何可以将TPR等价为m+，FPR等价为m_

倒斗的粽子 2019.01.27
FPR=FP/TN+FP，真实反例中预测反例的比例

ignorant96 2018.09.12
请问楼主，ROC曲线难道不是越接近（0,1）越完美吗？
- SWSACTWT回复拉普拉斯的啦 2021.03.08
  是的
- 拉普拉斯的啦回复ignorant96 2019.09.25
  [reply]ignorant96[/reply] 我觉得也是

TrytryAgian 2018.07.24
楼主你好，请问一下，2.5证明中求线段上方的单元格公式是怎么推导来的。

csu_summer 2018.03.11
楼主是华科的么？能再详细解释下2.5证明中所以从左到右...这话后面的内容么
- Casia.tao回复weixin_41850319 2020.07.26
  [reply]weixin_41850319[/reply]如果恰好有正例与反例的预测值相同，是会出现斜线的
- 晚秋garden回复Snoopy_Yuan 2019.06.14
  [reply]Snoopy_Yuan[/reply] 毕竟是离散的。我觉得在这里的话，斜线是可以很灵活的，可以人为规定，并没有严格的要求，有点像是一种偏好的引入吧。博主的答案写得很好！最近要考试周，所以正在刷课本习题，看了博主的证明终于想清楚了。感谢！
- csu_summer回复csu_summer 2018.04.10
  [reply]qq_30214939[/reply] 楼主你好，看了下推导，写的很棒啊！（字不错啊~~赞！！）多谢推导是的，我也是华科自动化学院的，因为你上一次推导的过程写在华科的作业纸上。。。
- Snoopy_Yuan回复csu_summer 2018.03.16
  [reply]qq_30214939[/reply] 嗯嗯（1）这里斜线的出现是对x:f(x+)=f(x-)这种样例的一种折衷画法，所以系数为0.5；（2）然后呢，n1和n2均是对每个负例进行的分析（水平，斜线），所以最后是沿着水平轴对n1&n2进行的求和（x- -- 外层求和符号），最后交换了以下求和符号嵌套顺序（使其和书上公式形式相同）。 ^-^这里的确答的不够清楚哈。
- weixin_41850319回复csu_summer 2018.03.16
  [reply]qq_30214939[/reply] 2.5: 根据ROC曲线的定义，使用离散画ROC时是不会出现斜线的，只能是平行于x轴或者是y轴。其次在你的解答中（先姑且不说斜线的问题），n1和n2的相加中的求和符号是不能直接放在一起的。两个求和符合是遍历所有的正反例对。
- Snoopy_Yuan回复csu_summer 2018.03.12
  [reply]qq_30214939[/reply] 你好，2.5题我重新写了下，你看看还有什么建议吗。（时隔好久，之前那个猛地一看自己也觉得不知所云^o^尴尬了）（另外你也是小科同学么o(∩_∩)o ？）