西瓜书——第二章 模型评估与选择总结

一、经验误差与过拟合

(1)什么是错误率?什么是精度?它们之间有什么关系?
(2)什么是经验误差?什么是泛化误差?
(3)什么是过拟合?相对应的什么是欠拟合?
该如何去克服过拟合与欠拟合?

二、评估方法

对样本的数据集进行适当处理,从中产生出训练集S和测试集T。具体方法如下:
(1)留出法;
需要注意的几个问题:
i、训练/测试集的划分要尽可能保持数据分布的一致性。避免因数据划分过程引入额外的偏差而对最终结果产生影响。
ii、即便在给定训练/测试集的样本比例后。仍存在多种划分方式对初始训练集D进行划分。因此,单次使用留出法得到的估计结果往往不够稳定可靠,在使用留出法时,有一般要采用若干次随即划分,重复进行实验评估后取平均值作为留出法的评估结果。
(2)交叉验证法
与留出法相似,将数据集D划分为k个子集同样存在多种划分方式,为减少因样本划分不同而引入的差别,k折交叉验证通常要随机使用不同的划分重复p次,最终的评估结果是这p次 k折交叉验证结果的均值。
(3)自助法
自助法在训练集较小,难以有效划分训练/测试集时很有用,此外,自助法能从初始数据集中产生多个不同的训练集,这对集成学习等方式有很大的好处。

三、调参与最终模型

四、性能度量

性能度量分为预测任务和分类任务

预测任务:
一般为“均方误差”

分类任务:
查准率(precision)、查全率(recall)、F1、
P-R曲线、

在n个二分类混淆矩阵上综合考虑查准率和查全率
方法1:
计算“宏查准率(macro-P)”、“宏查全率(macro-R)”、“宏F1(macro-F1)”
方法2:
计算“微查准率(micro-P)”、“微查全率(micro-R)”、“微F1(micro-F1)”

五、ROC与AUC

ROC曲线是研究学习器泛化性能的有利工具。

六、代价敏感错误率与代价曲线

(1)出现此问题的背景;
(2)如何去计算敏感代价的错误率;
(3)如何去画代价曲线?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值