PAC增长函数与VC维极简例子

最新推荐文章于 2021-12-18 18:48:49 发布

闵帆

最新推荐文章于 2021-12-18 18:48:49 发布

阅读量820

点赞数 5

分类专栏：机器学习基础文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/minfanphd/article/details/107251184

版权

机器学习基础专栏收录该内容

17 篇文章 6 订阅

订阅专栏

PAC增长函数与VC维极简例子

动机

从组合的方式，计算学习模型的表达能力。表达能力越强的模型越复杂。

例1：一个分割点

如图1所示，输入空间为实数轴。假设学习模型为一个分割点（一维上的分割超平面），将负类（三角形）与正类（圆形）分开。图1一个分割点

图1. 一个分割点的情况
计算增长函数：
对于m个数据而言，分割点

d

有

m + 1

个位置可选（两邻两个数据之间只能算一个位置）。

分割点 $d$ 左/右可以是正/负，也可以是负/正，因此有 $2 (m + 1)$ 种分类方式
$d$ 在最左边和最右边，均表示所有的样本预测为同一类，因此有2种重复的分类方式。
不同的分类方式有 $2 (m + 1) - 2 = 2 m$ 种。
计算VC维：
当 $m = 1$ 时， $2m = 2^m$ , OK;
当 $m = 2$ 时， $2*2 = 4 = 2^2$ , OK;
当 $m = 3$ 时， $2 * 3 = 6 < 8 = 2^3$ , 不满足等式，结束。
因此VC维=2.

例2：两个分割点

如图2所示，
Figure 2 two splitting points

图2. 两个分割点的情况
计算增长函数：
对于m个数据而言，分割点

l

,

r

有

m + 1

个位置可选（相邻两个数据之间只能算一个位置）。

不允许 $l$ 和 $r$ 在一起，共有 $C (m + 1, 2) = (m + 1) m / 2$ 种方式；
区间 $[l, r]$ 可以表示负（其余为正），也可以表示正（其余为负），要乘以2. 所以有 $(m + 1) m$ 种方式；
$[1, k]$ 和 $[k, m + 1]$ 是等价的 $\in [2..m]$ ，因此重复计算的方式数为 $2 (m - 1)$ 。
最终的方式数 $m+1)m - 2(m-1) = m^2-m+2$ 种。
计算VC维：
当 $m = 1$ 时， $m^2-m+2 = 2 = 2^m$ , OK;
当 $m = 2$ 时， $m^2-m+2 = 4 = 2^2$ , OK;
当 $m = 3$ 时， $m^2-m+2= 8 = 2^3$ , OK;
当 $m = 4$ 时， $m^2-m+2=14 < 2^4$ , 不满足等式，结束。
因此VC维=3.

讨论：

$m = 1$ 时居然成立；
这两个例子的VC维可以通过观察得到，因此，本贴仅仅是作为一种简单练习而存在。

参考文献
[1]: Foundations of Machine Learning.

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。