周志华-机器学习-读书笔记

最新推荐文章于 2023-08-31 15:06:42 发布

poptree hengli

最新推荐文章于 2023-08-31 15:06:42 发布

阅读量222

点赞数

分类专栏： ML 文章标签：机器学习神经网络

本文链接：https://blog.csdn.net/pootree/article/details/82766362

版权

ML 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

2 模型评估与选择

2.1 经验误差与过拟合

错误率（error rate）： $E = a / m$ , $E$ 为错误率， $a$ 为样本分类错误， $m$ 为总样本数
精度（accuracy）: $A = 1 - a / m = 1 - E$ ， $A$ 为精度
训练误差（training error）或经验误差（empirical error）：学习器在训练集上的误差
泛化误差（generalization error）：在新样本上的预测误差

期望：获得generalization error最小的学习器
实际：现实中不知道新样本是什么，所以只能使的empirical error 最小
问题：empirical error最小的学习器在多数情况下表现不好

过拟合（overfitting）：在训练集上的表现好，在预测集中表现不好；泛化性能下降
欠拟合（underfitting）：对训练样本的一般性质未学习好

造成overfitting和underfitting的原因？

overfitting是常见情况是因为学习能力过于强大，将训练样本中不太一般的特性也学习到了
underfitting通常是因为学习能力低下造成的

overfitting无法避免，只能缓解，为什么？

机器学习的问题通常是NP-hard问题，但是有效的学习算法是多项式时间内的算法。如果能彻底避免过拟合，则意经验误差最小化就能获得最优解，意味着构造性证明了P=NP，只要我们认为P!=NP，则过拟合不可避免。

2.2 评估方法

使用测试集（testing set）来测试学习机器对新样本的判别能力。
以在testing set上的testing error作为generalization error的近似。
testing set需要保证与training set保持互斥

2.2.1 留出法（hold-out）

描述：直接将training set分为两个互斥的集合。
注意事项：划分时需要保持数据分布的一致性。从sampling的角度来看是分层采样（stratified sampling）。

2.2.2 交叉验证法（cross validation）

描述：将数据集划分成k个大小相似的互斥子集。同样保证数据一致性。每次用 $k - 1$ 个子集进行训练，用剩下的1个子集进行测试。最终结果为 $k$ 次测试结果的均值。
注意事项：稳定性和保真性取决于k的取值。故cross validation通常被称为“k折交叉验证”（k flod cross validation）。K通常取10.常用的还有5,20.