林轩田机器学习基石笔记16：Three Learning Principles

最新推荐文章于 2019-10-19 22:40:02 发布

Augus_Xu

最新推荐文章于 2019-10-19 22:40:02 发布

阅读量677

点赞数

分类专栏：机器学习机器学习基石笔记文章标签：机器学习

本文链接：https://blog.csdn.net/qq_35044025/article/details/79254348

版权

22 篇文章 1 订阅

订阅专栏

18 篇文章 2 订阅

订阅专栏

上一节课讲解了机器学习中提升分类器泛化能力的一种方法–Validation。即讲数据分成训练样本和测试样本，用训练样本训练分类器，用测试样本筛选分类器，最后得到再测试样本中性能最好的分类器。这一节课我们讲解机器学习中非常实用的三个“锦囊妙计”。

奥卡姆剃刀定律（Occam’s Razor）：在选择模型的时候尽量选简单的，低阶的能用就别用高阶分类器。所以在选择分类器时，一般先从简单的开始考虑，或者用regularization，让hypothesis中参数个数减少，都能降低模型复杂度。
为什么要用简单的？看一个图就明白了：

右图的分类器更加复杂，但是从直觉上来看左边的模型更简单，符合人类直觉的解释方式。相应的，VC维更小、泛化能力更强。

Data Snooping：在选用模型的时候，尽量不要被数据所影响，而是根据经验和知识来做判断选择。比如说，测试数据集里包含训练样本就属于使用了数据的信息，这样子得到的分类器就不够正确，容易被表象所蒙蔽。

这一小节讲了三个锦囊妙计，并对16课进行了一个总结。机器学习基石课程结束了，下面开始机器学习技法课程。

关注