ML基石_7_VC

最新推荐文章于 2020-04-27 14:02:10 发布

Young_Gy

最新推荐文章于 2020-04-27 14:02:10 发布

阅读量623

点赞数

文章标签： ML基石

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/young_gy/article/details/48803313

版权

recap
- more on growth function
- more on VC bound
VC Definition
VC of perceptrons
physical intuition of VC
interpreting VC
summary

recap

之前，讨论了 theory of generation，也就是如果 $E_{in}$ 很小的时候，什么时候可以推至 $E_{out}$ 也很小。
我们的答案是，如果 $m_H(N)$ 在某些地方出现了一线曙光，也就是出现了break point，造成了不能shatter，增长速度达不到 $2^N$ 的速度的点，那么它的上限是poly多项式，同时如果N也很大的话，可以确定犯错误的上限在一定程度内。

more on growth function

当 $N>2,K>3$ 时， $m_H(N)<=N^{K-1}$ ，上限是一个多项式。
这里写图片描述

more on VC bound

保证了无论演算法做了任何的选择，都被VC bound所支配，保证挑出来的假设 $h$ 可以使得 $E_{in} \approx E_{out}$ 。
这里写图片描述

VC Definition

the formal name of maximum non-break point

比 $d_{vc}$ 大1的话，就是break point k。

d v c = min k - 1

$d_{vc} = \min k -1$

好的 $H_{set}$ ，一开始是说增长函数有漏出一线曙光，出现break point的点。现在可以说 $d_{vc}$ 有限的假设集就是好的假设集。

这里写图片描述

VC of perceptrons

对于特定的N，shatter的话只举一个例子就可以了，不shatter的话必须保证对于N个点的所有可能分布都不能shatter。

Revisited 2d

这里写图片描述

dvc>=d+1

只需要证明d+1个点的情况下可以shatter。
这里写图片描述

dvc<=d+1

只需证明d+2个点的情况下不可以shatter。
这里写图片描述

linear dependence restricts dichotomy.

physical intuition of VC

$d+1$ 就是d个perceptron的维度。

w就是degree of fredom
物理意义大致是：假设集，做二元分类的话有多少自由度(effective)。
举例子来说，二维的感知器有三个自由度(w0,w1,w2)。

powerfulness of H，可以产生多少个dichonomy。

有多少可以调的旋钮。代表H的自由度。

这里写图片描述

interpreting VC

model越强，vc更高，越能够shatter二分类，需要付出的model complety代价很大。

$E_{in}$ 做好不一定是最好的选择，可能会付出很大的模型复杂度的代价 $\Omega$ 。

penalty for model complexity

$E_out$ 和 $E_{in}$ 的差距和 $\Omega$ 有关

这里写图片描述

VC message

一般来说，我们考虑 $E_out$ 的容忍上限。

通常，我们希望vc很大，这样的话可以shatter的点很多，假设集的power更强，因此通常可以在 $E_{in}$ 上取得很好的效果。
但是，当模型的复杂度上升的时候， $E_{out}$ 的误差上限变大，也就是无法保证测试集外的结果和训练集有同样的高正确率，这样即使训练集内部正确率再高也无用。

因此，需要选择合适的vc，也就是选择合适的假设集，合适的模型复杂度。
这里写图片描述

sample complexity

一般来说，我们希望将犯错的的bound限制在一定的范围内，但是误差限度是提前制定的，这时候便需要考虑样本集的数量的。

样本集数量和bound的变化趋势如下图所示，因为这个bound的过程中有很多上限化简，因此理论的和实际的有所差异。
这里写图片描述

looseness of VC bound

理论和实际的差异如下。

有差异也不一定坏啊，这种差异是建立在模型泛化的基础上，从而可以使VC bound的适用条件变宽。

对于之后学习的模型，甚至可以用vc去比较。
这里写图片描述

summary

这里写图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Young_Gy CSDN认证博客专家 CSDN认证企业博客

码龄10年

151: 原创

12万+: 周排名

167万+: 总排名

71万+: 访问

: 等级

7253: 积分

518: 粉丝

362: 获赞

117: 评论

1512: 收藏

私信

关注

热门文章

最新评论

扩展卡尔曼滤波EKF与多传感器融合
qq_35210952: 这里题主应该再加个解释 1、这里用ekf的原因是毫米波的状态转移方程是非线性的。 2、激光雷达状态转移是线性的，所以激光雷达用kf更新 3、两类的预测为什么是相同的，因为都是在同一个状态空间下预测的,,所以两类就统一在一起，没必要单独算一遍，增加计算量（我猜的）。再看对当前状态的修正，用的就有区别了，因为当前状态获取毫米波雷达的数据不是xyz
扩展卡尔曼滤波EKF与多传感器融合
qq_35210952: 如果是radar的用KF修正，是LIDAR用EKF修正，这是咋设计的呢？下面的图给出的是EKF的效果，都混在一起咋看的效果呢
局部放电的特征选择
煎饼侠797: 跪求实验数据集227703401@qq.com
局部放电的特征选择
我是个可爱小白菜: 求数据集
局部放电的特征选择
Selling_dusk: 跪求试验数据1255906008@qq.com

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。