Lecture 4 : Error and Noise
视频地址:https://www.youtube.com/watch?v=L_0efNkdGMc
非线性变换(续)
误差衡量
h≈f
h
≈
f
意味着什么?
误差衡量:
E(h,f)
E
(
h
,
f
)
大部分都是逐点定义:
e(h(x),f(x))
e
(
h
(
x
)
,
f
(
x
)
)
例如:
由逐点到总体:
总体误差是逐点误差的平均。
- 样本内误差
Ein(h)=1N∑n=1Ne(h(xn),f(xn)) E i n ( h ) = 1 N ∑ n = 1 N e ( h ( x n ) , f ( x n ) ) - 样本外误差
Eout(h)=Ex[e(h(xn),f(xn))] E o u t ( h ) = E x [ e ( h ( x n ) , f ( x n ) ) ]
如何选取误差衡量?
指纹识别的例子,
+1
+
1
表示正确,
−1
−
1
表示错误。
有两种类型的误差 :错误的接受 以及 错误的拒绝。
对每种类型的惩罚:
h∖f h ∖ f | +1 | -1 |
---|---|---|
+1 | 无错 | 错误的接受 |
-1 | 错误的拒绝 | 无错 |
对误差的选取取决于问题是什么。
比如在超市中,验证指纹通过的顾客可以获得折扣。此时,错误的拒绝是代价大,而错误的接受代价则没那么大。惩罚可以采取:
h∖f h ∖ f | +1 | -1 |
---|---|---|
+1 | 0 | 1 |
-1 | 10 | 0 |
而在CIA的指纹验证上(可以进入政府部门等等),错误的接受是灾难!错误的拒绝则是可以容忍的。可能采取下面这种惩罚:
h∖f h ∖ f | +1 | -1 |
---|---|---|
+1 | 0 | 1000 |
-1 | 1 | 0 |
误差的衡量应该由使用者界定。
但不总是这样,一般用这些替代:
- Plausible measures: 平方误差 ≡ ≡ 高斯噪声
- Friendly measures: 封闭解 ,凸优化
含噪目标
目标函数不总是一个函数
例如银行信用例子里,通过与否并不是一个函数。
目标分布
用目标分布
P(y|x)
P
(
y
|
x
)
代替
y=f(x)
y
=
f
(
x
)
含噪目标= 确定的目标
f(x)=E(y|x)
f
(
x
)
=
E
(
y
|
x
)
加上噪声
y−f(x)
y
−
f
(
x
)