关于VC维的理解

最新推荐文章于 2022-12-28 00:12:20 发布

微丶念

最新推荐文章于 2022-12-28 00:12:20 发布

阅读量2.1w

点赞数 22

分类专栏：深度强化学习tips

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013745804/article/details/80834743

版权

深度强化学习tips 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

###简介
VC维，全称为Vapnik-Chervonenkis Dimension，它反映了模型的学习能力，VC维越大，则模型的容量越大。

###通俗定义
VC维的通俗定义是：对于一个指示函数集，如果存在 $H$ 个样本能够被函数集中的函数按所有可能的 $2^{H}$ 种形式分开，则称函数集能够将 $H$ 个样本打散，函数集的VC维就是它能够打散的最大样本数目 $H_{max}$ 。如果对任意数目的样本，在该函数集中都能找到函数将它们打散，则称该函数集的VC维是无穷大。
比如说，我们以二维平面中的线性分类器为例：

在按上图给定二维平面中的3个点的位置之后（并未给出标签），线性函数组成的集合能够对所有8种情形正确进行分类。值得注意的是，按照上述定义来看，只要存在3个样本能够被成功打散，并且不存在4个样本能够被打散的话，就称这一函数集合的VC维是3。所以，我们称二维线性函数集合所表示的分类器的VC维是3。
下面我们来看另外两个例子：
#####例1

#####例2

对于例1第二幅图中给定的3个点而言，显然二维线性函数集合不能对其正确分类；对于例2第二幅图中给定的4个点而言，也不能正确分类。因此，我们说二维线性函数集合的VC维是3。

###理解
我们知道，在机器学习中，常常用到“模型”的概念，实际上，模型就是假设空间中的一个函数。假设空间代表了一系列的函数，而我们的训练过程就是在这个集合中找到一个最优或近似最优的函数，来完成我们的任务。一般而言，VC维与模型容量成正相关关系。并不是与假设空间中模型个数正相关哦，比如说上面的二维线性函数集合，其中有无数个线性函数，但是其VC维仍然为3。

###参考
本文只是对VC维进行了简要介绍，更加理论的部分大家可以参考博文《机器学习和数据挖掘（7）：VC维》。这篇博文我没仔细看，有兴趣的同学可以自己琢磨琢磨。

关注

22
点赞
踩
79

收藏

觉得还不错? 一键收藏
6
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

微丶念 CSDN认证博客专家 CSDN认证企业博客

码龄11年

87: 原创

9万+: 周排名

76万+: 总排名

47万+: 访问

: 等级

4709: 积分

502: 粉丝

522: 获赞

282: 评论

1351: 收藏

私信

关注

热门文章

分类专栏

LeetCode：Actions are more important than words 12篇
OpenAI Baselines源码阅读 1篇
TensorFlow理解与应用 3篇
机器人学 1篇
小白的CV学习记录
你好，强化学习
Baselines源码阅读 1篇
深度强化学习tips 3篇
David Silver强化学习课程笔记 9篇
PRML读书笔记
RL读书笔记
《统计学习方法》速读 3篇
机器人学
ROS学习 5篇
论文阅读与实现 4篇
LeetCode 12篇
Python学习笔记 21篇
菜鸟教程：Python 100例实践
TensorFlow学习笔记 6篇
深入TensorFlow 3篇
TFLearn学习笔记 4篇
OpenAI Gym学习笔记 7篇
Git学习笔记 2篇
C++学习笔记 2篇
《Effective C++》每日一条 3篇
《鸟哥的私房菜》学习笔记 1篇
算法实现 1篇

最新评论

关于VC维的理解
const LA: https://blog.csdn.net/qq_26547843/article/details/106288464这个讲的很清楚
Gym小记（五）
qq_35845146: 看看我的赛道3117 最佳941分 GYM CARRACING 人工智能 Selfattention 谷歌大脑自注意力赛车赛道3117,best performen 941分,可视化,焦点,_哔哩哔哩_bilibili
David Silver强化学习课程笔记（七）
z樾: 梯度上升.
David Silver强化学习课程笔记（五）
z樾: 是不是可以理解为如果是一步的话无论是greedy还是€greedy 选什么行为At获得什么Rt+1都其实只是一个概率而已可以理解没有区别，当多步的时候考虑到后续如Rt+2其实是由行为At+1导致的再往前推就是由At导致这是一个序列可以理解为是服从某种分布的序列，此时就无法忽视重要性采样了博主看理解对不对呢
David Silver强化学习课程笔记（一）
z樾: 1.其实就是所提到的奖励有延迟，因为奖励是理解为环境给出的，所以Agent在t时刻接收到obs(t)和R（t)做出A(t)，环境接收到A（t)再做出反馈，很明显由A(t)所导致的R是下一时刻的。2.预测，就是说给你一个策略，估计该策略能够得到多少回报，控制就是说从策略中到找一个回到最多的策略，所以网格中才是给出箭头（policy)而不是数字

最新文章

目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。