Lecture 5 : Training versus Testing
视频地址:https://www.youtube.com/watch?v=SEYAnnLazMU
测试与训练
用期末考试举例。
测试:
训练:
M
M
从哪里来?
不好的事件 是 ’
|Ein−Eout|>ϵ
|
E
i
n
−
E
o
u
t
|
>
ϵ
‘
联合边界:
可以在 M M 上进行改进吗?
不好的事件非常重叠。
![9QLNLT.png](https://i-blog.csdnimg.cn/blog_migrate/5db79552041fdae91563ee56dc000530.png)
蓝线和绿线是两个分界面。
替代 M M
用输入点的有限集合来替代所有的输入空间,并且计算二分法(假设)的数量
二分法:微型假设
一个假设
一个二分
h:{x1,x2,⋯,xN}→{−1,+1}
h
:
{
x
1
,
x
2
,
⋯
,
x
N
}
→
{
−
1
,
+
1
}
假设集
|H|
|
H
|
的数量无限的。
二分集合
|H(x1,x2,⋯,xN)|
|
H
(
x
1
,
x
2
,
⋯
,
x
N
)
|
的数量最多为
2N
2
N
The growth function
计算了
N
N
点上最多的二分集
growth function满足 : mH(N)≤2N m H ( N ) ≤ 2 N
- mH(3)=8 m H ( 3 ) = 8
- mH(4)=14 m H ( 4 ) = 14 (当+1点在对角线上时无法分割)
examples
1.射线
2.区间
3.凸集
根据下图理解:
![9QLwo4.png](https://i-blog.csdnimg.cn/blog_migrate/ac9301307407331e0edb2bbaf7d4bce3.png)
N N 个点被凸集“shatter”了
当 替代
M
M
时会怎样?
只需证明 是多项式
break point
定义: 如果没有大小为 k k 的数据集可以被 ‘shatter’,那么 k k 就是 的一个break point
对于2维的感知机,break point是 k=4 k = 4
继续前面的例子:
- 对于射线 mH(N)=N+1 m H ( N ) = N + 1 , break point 是 k=2 k = 2
- 对于区间 mH(N)=12N2+12N+1 m H ( N ) = 1 2 N 2 + 1 2 N + 1 , break point 是 k=3 k = 3
- 对于凸集 mH(N)=2N m H ( N ) = 2 N , break point 是 k=∞ k = ∞
结论
没有break point
⟹mH(N)=2N
⟹
m
H
(
N
)
=
2
N
有break point
⟹mH(N)
⟹
m
H
(
N
)
是
N
N
<script type="math/tex" id="MathJax-Element-40">N</script> 的多项式