Coursera - 机器学习基石 - 课程笔记 - Week 5

最新推荐文章于 2024-07-25 18:39:37 发布

支锦铭

最新推荐文章于 2024-07-25 18:39:37 发布

阅读量153

点赞数

分类专栏： Cousera-课程笔记文章标签：人工智能机器学习

本文链接：https://blog.csdn.net/cary_leo/article/details/105885615

版权

141 篇文章 17 订阅

订阅专栏

Training versus Testing

静态学习流程：
- 如果 $|\mathcal H| = M$ 有限， $N$ 足够大
- 对任意一个被选择的 $g$ ， $E_{out}(g) \approx E_{in}(g)$
- 如果选择了一个 $g$ ， $E_{in}(g) \approx 0$ ，PAC保证 $E_{out}(g) \approx 0$ （学习可行）
由之前的课程可知，M的取值太大或者太小都很不好
无限大的M（PLA中），会产生什么样的影响？

针对既有点的可行的划分情况：二分图（dichotomy）
定义 $\mathcal{H}(\bold x_1,\bold x_2, \ldots, \bold x_N) = (h(\bold x_1), h(\bold x_2), \ldots, h(\bold x_N))$ 为定义在数据 $\bold x_1,\bold x_2, \ldots, \bold x_N$ 上的全部二分图
所有二分图的集合内容个数上界最多为 $2^N$
考虑到n个数据点的二分图结果依赖于数据本身，我们将理论成长函数取所有情况的最大值：
- $m_{\mathcal H}(N) = \max\limits_{\bold x_1,\bold x_2, \ldots, \bold x_N \in \mathcal X}|\mathcal H(\bold x_1,\bold x_2, \ldots, \bold x_N)|$
四类成长函数：
- 正向一维数据： $m_{\mathcal H}(N) = N +1$
- 正向一维区间： $m_{\mathcal H}(N) = \frac12N^2+\frac12N+1$
- 凸二维集： $m_{\mathcal H}(N) = 2^N$
- 二维感知器： $m_{\mathcal H}(N) < 2^N$

如果使用 $m_{\mathcal H}(N)$ 代替M估计上界：
- 优点：避免无限大M对结果的影响
- 缺点：指数增长
突破点：以二维感知器空间为例，不再得到指数个二分图的输入个数
- $m_{\mathcal H}(k) < 2^k$
- 往后的k都是突破点
- 目前只考虑最小的k（也就是4）

关注

专栏目录