林轩田机器学习基石心得7：The VC Dimension

最新推荐文章于 2020-04-26 16:29:46 发布

Augus_Xu

最新推荐文章于 2020-04-26 16:29:46 发布

阅读量293

点赞数

分类专栏：机器学习机器学习基石笔记文章标签：机器学习

本文链接：https://blog.csdn.net/qq_35044025/article/details/79131873

版权

22 篇文章 1 订阅

订阅专栏

18 篇文章 2 订阅

订阅专栏

该文章为本人观看视频心得，详细笔记可前往：
http://blog.csdn.net/red_stone1/article/details/71191232

前一课中着重介绍了机器能够学习的条件并做了详细的推导和解释。机器学习可行需要满足两个条件：
- $E_{in} \approx E_{out}$
- $E_{in} \approx 0$

上次课引入了break point，并推导出只要break point存在，则M有上界，一定存在 $E_{in} \approx E_{out}$
这次课主要介绍VC维。

两点结论（对应机器学习要解决的两个问题）：
- 若假设空间H有break point k，且N足够大，则根据VC bound理论，算法有良好的泛化能力
- 在假设空间中选择一个g，使 $E_{in} \approx 0$ ，则其在全集数据中的错误率会较低。
VC Dimension（VC维）：可以被shatter的最多样本个数。

shatter：shatterN个样本就是说一共有 $2^N$ 种假设函数分类方法。
VC维的值为break point -1。

这里写图片描述

VC维的物理意义：自由度。
举例：比如当样本维度为2时，VC维为3，自由度也为3。
- 考虑1：假设函数是一个直线： $y=w_1x+w_0$ ，其中 $w_1$ 和 $w_0$ 为两个自由度，另外一个自由度是指直线上方的是正还是负。
- 考虑2：假设函数为： $y=sign(w_2x_2+w_1x_1+w_0)$ ，其中一共需要3个特征。

$E_{out}$ 和 $E_{in}$ 的差距可以反映模型复杂度。
VC维， $E_{out}$ 和， $E_{in}$ 及模型复杂度 $\Omega$ 的关系：
我们的目的是找到最小的 $E_{out}$ ，所以不能一味的使分类器复杂化（提升VC维，提升自由度）而减小 $E_{in}$ 。我们需要找到合适的 $E_{in}$ 。

这次课主要介绍了VC维的定义及其物理意义，我们也知道假设函数并不是越复杂越好的，需要找到合适的。

关注