Machine Learning Course-CS 156 笔记 5

Lecture 5 : Training versus Testing

视频地址:https://www.youtube.com/watch?v=SEYAnnLazMU


测试与训练

用期末考试举例。
测试:

P[|EinEout|>ϵ]2e2ϵ2N P [ | E i n − E o u t | > ϵ ] ≤ 2 e − 2 ϵ 2 N

训练:
P[|EinEout|>ϵ]2Me2ϵ2N P [ | E i n − E o u t | > ϵ ] ≤ 2 M e − 2 ϵ 2 N

M M 从哪里来?
不好的事件 Bm 是 ’ |EinEout|>ϵ | E i n − E o u t | > ϵ

联合边界:

P[B1B2BM]P[B1]+P[B2]++P[BM] P [ B 1 ∪ B 2 ∪ ⋯ ∪ B M ] ≤ P [ B 1 ] + P [ B 2 ] + ⋯ + P [ B M ]

可以在 M M 上进行改进吗?
不好的事件非常重叠。
9QLNLT.png
蓝线和绿线是两个分界面。
ΔEout:+11ΔEin:|Ein(h1)Eout(h1)||Ein(h2)Eout(h2)|

替代 M M
用输入点的有限集合来替代所有的输入空间,并且计算二分法(假设)的数量

二分法:微型假设
一个假设 h:X{1,+1}
一个二分 h:{x1,x2,,xN}{1,+1} h : { x 1 , x 2 , ⋯ , x N } → { − 1 , + 1 }

假设集 |H| | H | 的数量无限的。
二分集合 |H(x1,x2,,xN)| | H ( x 1 , x 2 , ⋯ , x N ) | 的数量最多为 2N 2 N

The growth function
计算了 N N 点上最多的二分集

mH(N)=maxx1,,xNX|H(x1,,xN)|

growth function满足 : mH(N)2N m H ( N ) ≤ 2 N

  • mH(3)=8 m H ( 3 ) = 8
  • mH(4)=14 m H ( 4 ) = 14 (当+1点在对角线上时无法分割)

examples

1.射线
9QLaeU.png

Hh:R{1,+1}h(x)=sign(xa)mH(N)=N+1 H 是 h : R → { − 1 , + 1 } 的 集 合 h ( x ) = s i g n ( x − a ) m H ( N ) = N + 1

2.区间
9QLdwF.png

Hh:R{1,+1}mH(N)=C2N+1+1=12N2+12N+1 H 是 h : R → { − 1 , + 1 } 的 集 合 m H ( N ) = C N + 1 2 + 1 = 1 2 N 2 + 1 2 N + 1

3.凸集
9QLYQ0.png

Hh:R2{1,+1}mH(N)=2N H 是 h : R 2 → { − 1 , + 1 } 的 集 合 m H ( N ) = 2 N

根据下图理解:
9QLwo4.png
N N 个点被凸集“shatter”了

mH(N) 替代 M M 时会怎样?
只需证明 mH(N) 是多项式


break point

定义: 如果没有大小为 k k 的数据集可以被 H ‘shatter’,那么 k k 就是 H 的一个break point

对于2维的感知机,break point是 k=4 k = 4

继续前面的例子:

  • 对于射线 mH(N)=N+1 m H ( N ) = N + 1 , break point 是 k=2 k = 2
  • 对于区间 mH(N)=12N2+12N+1 m H ( N ) = 1 2 N 2 + 1 2 N + 1 , break point 是 k=3 k = 3
  • 对于凸集 mH(N)=2N m H ( N ) = 2 N , break point 是 k= k = ∞

结论

没有break point mH(N)=2N ⟹ m H ( N ) = 2 N
有break point mH(N) ⟹ m H ( N ) N N <script type="math/tex" id="MathJax-Element-40">N</script> 的多项式

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值