机器学习笔记
singsing_
这个作者很懒,什么都没留下…
展开
-
机器学习笔记3——训练集、验证集、测试集
训练集一般没有什么疑问,就是用来训练模型的数据集主要的疑问在于验证集和测试集首先来看周志华《机器学习》中的原文:通常,我们可通过试验测试来对学习器的繁华误差进行评估并进而做出选择。为此,需使用一个“测试集”来测试学习器对新样本的判别能力,然后以测试集上的“测试误差”作为泛化误差的近似。通常我们假设测试样本也是从样本真实样本中独立同分布采样而得。但需要注意的是,测试集应尽可能与训练集互斥,即测试样本尽量不在训练集中出现、未在训练过程中使用过。另外,需要注意的是,我们通常把学得模型在实际使用中遇到的数据原创 2021-09-06 20:39:37 · 583 阅读 · 0 评论 -
机器学习笔记2——评估方法
目的:希望得到泛化误差小的学习器。原创 2021-09-06 19:56:44 · 197 阅读 · 0 评论 -
机器学习笔记1-“没有免费的午餐”定理(No Free Lunch Theorem)
教材-周志华《机器学习》绪论各种基本术语不再赘述,大部分都可以望文生义。“没有免费的午餐”定理(No Free Lunch Theorem)(简称NFL定理):该定理的结论是,由于对所有可能函数的相互补偿,最优化算法的性能是等价的。该定理暗指,没有其它任何算法能够比搜索空间的线性列举或者纯随机搜索算法更优。该定理只是定义在有限的搜索空间,对无限搜索空间结论是否成立尚不清楚。该定理的前提时:所有“问题”出现的机会相同、或所有问题同等重要。但实际情形我们只需要为特定的问题找到解决方案,而不关注该方案在别的原创 2021-09-06 18:51:40 · 2039 阅读 · 0 评论