原文地址:http://www.douban.com/note/156576731/
2011-06-16 17:40:43
念书时第一次听到这个结论,顿时目瞪口呆,随机性和高维结合起来居然有这么漂亮的结论,因为太过震撼,多年以后仍依稀记得,今天下午设计算法时再次用到,试着回想了一下证明过程,记于此。
查看公式,需要安装 插件。
在n维空间中,给定一个向量[;v_1;],不妨假设其为最后一个单位向量,即(0,0……1),问:随机给定一个向量[;v_2;],[;v_1;]与[;v_2;]正交的可能性有多大?
因为两个向量正交与否与向量的长度无关,因此不妨设[;v_2;]为单位向量,并且采用球面坐标系,则[;v_2;]
可以用n-1个角度构成的向量来表示,即[;(a_1,...a_{n-1});],则向量在此n-1维球面上呈现均匀分布意味着:
[;p(a_1,...a_{n-1})=\prod_{i=1}^{n-2}(sin a_i)^{n-i-1};]
此时[;a_1;]即为[;v_1;]和[;v_2;]的夹角,将上式对除[;a_1;]外的其他n-2变量求积分(需要注意,其中一个变量的积分范围为[;[0,2\pi];],其他n-3个变量的积分范围都是[;[0,\pi];]),便得到:
[;p(a_1)=(sin a_1)^{n-2};]。
大家可以代入n=1000,画一下这条概率密度曲线,便会发现几乎所有的分布质量都集中在[;\frac{\pi}{2};]附近,因此[;v_1;]与[;v_2;]正交。
查看公式,需要安装 插件。
在n维空间中,给定一个向量[;v_1;],不妨假设其为最后一个单位向量,即(0,0……1),问:随机给定一个向量[;v_2;],[;v_1;]与[;v_2;]正交的可能性有多大?
因为两个向量正交与否与向量的长度无关,因此不妨设[;v_2;]为单位向量,并且采用球面坐标系,则[;v_2;]
可以用n-1个角度构成的向量来表示,即[;(a_1,...a_{n-1});],则向量在此n-1维球面上呈现均匀分布意味着:
[;p(a_1,...a_{n-1})=\prod_{i=1}^{n-2}(sin a_i)^{n-i-1};]
此时[;a_1;]即为[;v_1;]和[;v_2;]的夹角,将上式对除[;a_1;]外的其他n-2变量求积分(需要注意,其中一个变量的积分范围为[;[0,2\pi];],其他n-3个变量的积分范围都是[;[0,\pi];]),便得到:
[;p(a_1)=(sin a_1)^{n-2};]。
大家可以代入n=1000,画一下这条概率密度曲线,便会发现几乎所有的分布质量都集中在[;\frac{\pi}{2};]附近,因此[;v_1;]与[;v_2;]正交。
2011-06-16 17:40:43
念书时第一次听到这个结论,顿时目瞪口呆,随机性和高维结合起来居然有这么漂亮的结论,因为太过震撼,多年以后仍依稀记得,今天下午设计算法时再次用到,试着回想了一下证明过程,记于此。
查看公式,需要安装 插件。
在n维空间中,给定一个向量[;v_1;],不妨假设其为最后一个单位向量,即(0,0……1),问:随机给定一个向量[;v_2;],[;v_1;]与[;v_2;]正交的可能性有多大?
因为两个向量正交与否与向量的长度无关,因此不妨设[;v_2;]为单位向量,并且采用球面坐标系,则[;v_2;]
可以用n-1个角度构成的向量来表示,即[;(a_1,...a_{n-1});],则向量在此n-1维球面上呈现均匀分布意味着:
[;p(a_1,...a_{n-1})=\prod_{i=1}^{n-2}(sin a_i)^{n-i-1};]
此时[;a_1;]即为[;v_1;]和[;v_2;]的夹角,将上式对除[;a_1;]外的其他n-2变量求积分(需要注意,其中一个变量的积分范围为[;[0,2\pi];],其他n-3个变量的积分范围都是[;[0,\pi];]),便得到:
[;p(a_1)=(sin a_1)^{n-2};]。
大家可以代入n=1000,画一下这条概率密度曲线,便会发现几乎所有的分布质量都集中在[;\frac{\pi}{2};]附近,因此[;v_1;]与[;v_2;]正交。
查看公式,需要安装 插件。
在n维空间中,给定一个向量[;v_1;],不妨假设其为最后一个单位向量,即(0,0……1),问:随机给定一个向量[;v_2;],[;v_1;]与[;v_2;]正交的可能性有多大?
因为两个向量正交与否与向量的长度无关,因此不妨设[;v_2;]为单位向量,并且采用球面坐标系,则[;v_2;]
可以用n-1个角度构成的向量来表示,即[;(a_1,...a_{n-1});],则向量在此n-1维球面上呈现均匀分布意味着:
[;p(a_1,...a_{n-1})=\prod_{i=1}^{n-2}(sin a_i)^{n-i-1};]
此时[;a_1;]即为[;v_1;]和[;v_2;]的夹角,将上式对除[;a_1;]外的其他n-2变量求积分(需要注意,其中一个变量的积分范围为[;[0,2\pi];],其他n-3个变量的积分范围都是[;[0,\pi];]),便得到:
[;p(a_1)=(sin a_1)^{n-2};]。
大家可以代入n=1000,画一下这条概率密度曲线,便会发现几乎所有的分布质量都集中在[;\frac{\pi}{2};]附近,因此[;v_1;]与[;v_2;]正交。