统计学习精要 (Elements of Statistical Learning ) 习题 2.4
问题:
The edge effect problem discussed on page 23 is not peculiar to uniform sampling from bounded domains. Consider inputs drawn from a spherical multinormal distribution
X∼N(0,Ip)
. The squared distance from any sample point to the origin has a
X2p
distribution with mean
p
. Consider a prediction point
Show that the
zi
are distributed
N(0,1)
with expected squared distance from the origin
1
, while the target point has expected squared distance
对于在一定有界范围中的均匀抽样来说,第23页所讨论的边界效应问题并不是一个特殊或奇怪的现象。假设我们有一些从多维球状正态分布
证明
思路:
首先说明一下第一部分的一个点。对于任意随机向量
如果一个有限维随机向量服从多维正态分布的,那么其元素的任意线性组合服从一维正态分布。(参考维基百科)因此,
zi
都服从正态分布。而且,
因此
zi
服从标准正态分布。
zi
到原点的距离平方为
z2i
,服从自由度为
1
的卡方分布,因此期望为1。 而
其中 E(x20i)=Var(x0i)+E(x0i)2 .
所以, x0 到原点距离大概在 p‾‾√ 个标准差,但其他点只有一个标准差。从 x0 看来,相对其他点自己很可能是个“异常点”。