机器学习基石 5.3 Effective Number of Hypotheses

1. Dichotomies: Mini-hypotheses

原来的hypothesis set:

这里写图片描述

引入新概念:

dichotomy:只关注hypothesis作用在 x 1 , x 2 , ⋯   , x N \mathbf{x_{1}},\mathbf{x_{2}},\cdots,\mathbf{x_{N}} x1,x2,,xN上的结果,这样就可以把所有的hypothesis像上一节一样进行分类。

这里写图片描述


h ( x 1 , x 2 , ⋯   , x N ) = ( h ( x 1 ) , h ( x 2 ) , ⋯   , h ( x N ) ) ∈ { × , ◯ } N h(\mathbf{x_{1}},\mathbf{x_{2}},\cdots,\mathbf{x_{N}})=(h(\mathbf{x_{1}}),h(\mathbf{x_{2}}),\cdots,h(\mathbf{x_{N}})) \in \{\times ,\bigcirc\}^N h(x1,x2,,xN)=(h(x1),h(x2),,h(xN)){×,}N

这里写图片描述

这里写图片描述

希望可以用 ∣ H ( x 1 , x 2 , ⋯   , x N ) ∣ |\mathcal{H}(\mathbf{x_{1}},\mathbf{x_{2}},\cdots,\mathbf{x_{N}})| H(x1,x2,,xN)来代替原来的 M M M

这里写图片描述

2. Growth Function

然而 ∣ H ( x 1 , x 2 , ⋯   , x N ) ∣ |\mathcal{H}(\mathbf{x_{1}},\mathbf{x_{2}},\cdots,\mathbf{x_{N}})| H(x1,x2,,xN)与输入的 ( x 1 , x 2 , ⋯   , x N ) (\mathbf{x_{1}},\mathbf{x_{2}},\cdots,\mathbf{x_{N}}) (x1,x2,,xN)有关。

这里写图片描述

用其最大值来摆脱输入的依赖。

这里写图片描述

比如:
m H ( 1 ) = 2 m_{H}(1) =2 mH(1)=2
m H ( 2 ) = 4 m_{H}(2) =4 mH(2)=4
m H ( 3 ) = 8 m_{H}(3) =8 mH(3)=8
m H ( 4 ) = 14 m_{H}(4) =14 mH(4)=14

这里写图片描述

3. Growth Function for Positive Rays

考虑一个简单的情况:Positive Rays
h ( x ) = { 1 , x > t h r e s h o l d − 1 , x ⩽ t h r e s h o l d h(x) = \begin{cases} 1, &x>threshold\\ -1, &x\leqslant threshold \end{cases} h(x)={1,1,x>thresholdxthreshold

这里写图片描述

相当于一维的perceptrons的一半。

这里写图片描述

易得

这里写图片描述

H ( x 1 , x 2 , ⋯   , x N ) \mathcal{H}(\mathbf{x_{1}},\mathbf{x_{2}},\cdots,\mathbf{x_{N}}) H(x1,x2,,xN)中每一个 h ( x 1 , x 2 , ⋯   , x N ) \mathcal{h}(\mathbf{x_{1}},\mathbf{x_{2}},\cdots,\mathbf{x_{N}}) h(x1,x2,,xN)的样子

这里写图片描述

N N N很大时, N + 1 N+1 N+1远小于 2 N 2^N 2N

这里写图片描述

4. Growth Function for Positive Intervals

考虑另外一种情况:Positive Intervals
范围内为+1,范围外为-1。

这里写图片描述

它的 m H ( N ) m_{H}(N) mH(N)

这里写图片描述

N N N个点把数轴分为 N + 1 N+1 N+1段,如果范围的两个端点放在不同的段内,那么一共有$
\begin{pmatrix}
N+1 \
2 \
\end{pmatrix}
$种,如果放在同一段内,那么只有1种。

H ( x 1 , x 2 , ⋯   , x N ) \mathcal{H}(\mathbf{x_{1}},\mathbf{x_{2}},\cdots,\mathbf{x_{N}}) H(x1,x2,,xN)中每一个 h ( x 1 , x 2 , ⋯   , x N ) \mathcal{h}(\mathbf{x_{1}},\mathbf{x_{2}},\cdots,\mathbf{x_{N}}) h(x1,x2,,xN)的样子

这里写图片描述

这个结果在 N N N很大时也是远小于 2 N 2^N 2N的。

这里写图片描述

5. Growth Function for Convex Sets

考虑 h h h为平面上的一个凸包的情况

这里写图片描述

x \mathbf{x} x在凸包内部时, h ( x ) = 1 h(\mathbf{x})=1 h(x)=1,否则 h ( x ) = − 1 h(\mathbf{x})=-1 h(x)=1

这里写图片描述

一种可能的输入:所有的点都在一个大圆上。

这里写图片描述

这时无论每个点对应的是圈还是叉,都能找到一种凸包对应一个dichotomy。

这里写图片描述

6. Fun Time

这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值