林轩田机器学习基石心得7:The VC Dimension

该文章为本人观看视频心得,详细笔记可前往:
http://blog.csdn.net/red_stone1/article/details/71191232

0. 前言

前一课中着重介绍了机器能够学习的条件并做了详细的推导和解释。机器学习可行需要满足两个条件:
- EinEout
- Ein0

上次课引入了break point,并推导出只要break point存在,则M有上界,一定存在 EinEout
这次课主要介绍VC维。

1. Definition of VC Dimension

  1. 两点结论(对应机器学习要解决的两个问题):
    • 若假设空间H有break point k,且N足够大,则根据VC bound理论,算法有良好的泛化能力
    • 在假设空间中选择一个g,使 Ein0 ,则其在全集数据中的错误率会较低。
      这里写图片描述
  2. VC Dimension(VC维):可以被shatter的最多样本个数。

    shatter:shatterN个样本就是说一共有 2N 种假设函数分类方法。

  3. VC维的值为break point -1。

这里写图片描述

2. VC Dimension of Perceptrons

  1. 证明得到:对于线性二分类问题,VC维的值为样本维度+1。即
    dvc=d+1

3. Physical Intuition VC Dimension

  1. VC维的物理意义:自由度。
  2. 举例:比如当样本维度为2时,VC维为3,自由度也为3。
    • 考虑1:假设函数是一个直线: y=w1x+w0 ,其中 w1 w0 为两个自由度,另外一个自由度是指直线上方的是正还是负。
    • 考虑2:假设函数为: y=sign(w2x2+w1x1+w0) ,其中一共需要3个特征。

4. Interpreting VC Dimension

  1. Eout Ein 的差距可以反映模型复杂度。
    这里写图片描述

  2. VC维, Eout 和, Ein 及模型复杂度 Ω 的关系:
    这里写图片描述

  3. 我们的目的是找到最小的 Eout ,所以不能一味的使分类器复杂化(提升VC维,提升自由度)而减小 Ein 。我们需要找到合适的 Ein

5. 总结

这次课主要介绍了VC维的定义及其物理意义,我们也知道假设函数并不是越复杂越好的,需要找到合适的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值