Coursera - 机器学习基石 - 课程笔记 - Week 7

最新推荐文章于 2024-07-25 00:08:05 发布

支锦铭

最新推荐文章于 2024-07-25 00:08:05 发布

阅读量160

点赞数

分类专栏： Cousera-课程笔记文章标签：人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cary_leo/article/details/105898324

版权

Cousera-课程笔记专栏收录该内容

141 篇文章 17 订阅

订阅专栏

The VC Dimension

Definition of VC Dimension

可以学习的情形：
- $m_{\mathcal H}(N)$ 在 $k$ 处为突破点（好的假设集 $\mathcal H$ ）
- $N$ 足够大（好的数据集 $\mathcal D$ ），（大概率）使得 $E_{in}(h) \approx E_{out}(h)$
- 有一个算法 $\mathcal A$ ，能够选择一个有较小 $E_{in}(h)$ 的模式 $g$ （好的算法 $\mathcal A$ ）
- （大概率）可以实现学习
VC维度：对最大的非突破点的形式化名称，（ $d_{vc}=k-1$ ）
$\le d_{vc}$ ，假设集H可以被N完全分割
$\gt d_{vc}$ ，N是假设集H上的一个突破点
当 $d_{vc}$ 有限时，可以推导出 $g$ 是能够泛化的（ $E_{in}(g) \approx E_{out}(g)$ ）
- 和算法A本身无关
- 对输入的概率分布无关
- 和目标函数无关

VC Dimension of Perceptron

1D感知器， $d_{vc}$ 为2
2D感知器， $d_{vc}$ 为3
dD感知器， $d_{vc}$ 为d+1（可证）

Physical Intuition of VC Dimension

假设集参数 $\bold w = (w_0, w_1, \ldots, w_d)$ 创建了自由度
假设集的个数 $M=|\mathcal H|$ 类比了自由度
假设集的强度 $d_{vc}=d+1$ 决定了有效的二元分类的自由度
对M的分析可以等价替换为对 $d_{vc}$ 的分析
选择一个合适的 $d_{vc}$ 十分重要

Interpreting VC Dimension

对VC界限的一种思考：模型复杂度
- 指定假设坏模式的概率为 $\delta=4(2N)^{d_{vc}}\exp(-\frac18\epsilon^2N)$
- 那么在概率下，我们可以根据泛化误差（ $|E_{out}(g)-E_{in}(g)| \le \sqrt{ \frac 8 N \ln (\frac {4(2N)^{d_{vc}}} {\delta})}$ ）来导出最坏上界： $E_{out}(g) \le E_{in}(g) + \sqrt{ \frac 8 N \ln (\frac {4(2N)^{d_{vc}}} {\delta})}$
- 后一项记为 $\Omega(N,\mathcal H,\delta)$ ，称为对模式复杂性的惩罚项
- 当 $d_{vc}$ 上升，内误差会下降但模式复杂性会上升
- 当 $d_{vc}$ 下降，模式复杂性会下降，但内误差会上升
- 最佳的（外误差最小） $d_{vc}^\ast$ 在中间位置
另外一个说法：样本复杂度
- 理论上需要万倍于 $d_{vc}$ 的数据量
- 实际上，大约十倍于 $d_{vc}$ 的数据量可以满足误差要求
很宽松
在已知 $d_{vc}$ 的情况下，认知模型有多复杂，并估计需要多少的样本实现学习

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Coursera - 机器学习基石 - 课程笔记 - Week 7

The VC DimensionDefinition of VC Dimension可以学习的情形：mH(N)m_{\mathcal H}(N)mH(N)在kkk处为突破点（好的假设集H\mathcal HH）NNN足够大（好的数据集D\mathcal DD），（大概率）使得Ein(h)≈Eout(h)E_{in}(h) \approx E_{out}(h)Ein(h)≈Eout...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。