为什么高维空间中的任给两个向量几乎都正交？

最新推荐文章于 2022-04-15 16:59:26 发布

xceman1997

最新推荐文章于 2022-04-15 16:59:26 发布

阅读量5.2k

点赞数

分类专栏：机器学习

机器学习专栏收录该内容

143 篇文章 0 订阅

订阅专栏

原文地址：http://www.douban.com/note/156576731/

2011-06-16 17:40:43

   念书时第一次听到这个结论，顿时目瞪口呆，随机性和高维结合起来居然有这么漂亮的结论，因为太过震撼，多年以后仍依稀记得，今天下午设计算法时再次用到，试着回想了一下证明过程，记于此。 
  
 查看公式，需要安装 
  插件。 
  
 在n维空间中，给定一个向量[;v_1;]，不妨假设其为最后一个单位向量，即（0,0……1），问：随机给定一个向量[;v_2;]，[;v_1;]与[;v_2;]正交的可能性有多大？ 
  
 因为两个向量正交与否与向量的长度无关，因此不妨设[;v_2;]为单位向量，并且采用球面坐标系，则[;v_2;] 
  
 可以用n-1个角度构成的向量来表示，即[;(a_1,...a_{n-1});]，则向量在此n-1维球面上呈现均匀分布意味着： 
  
 [;p(a_1,...a_{n-1})=\prod_{i=1}^{n-2}(sin a_i)^{n-i-1};] 
  
 此时[;a_1;]即为[;v_1;]和[;v_2;]的夹角，将上式对除[;a_1;]外的其他n-2变量求积分（需要注意，其中一个变量的积分范围为[;[0,2\pi];]，其他n-3个变量的积分范围都是[;[0,\pi];]），便得到： 
  
 [;p(a_1)=(sin a_1)^{n-2};]。 
  
 大家可以代入n=1000，画一下这条概率密度曲线，便会发现几乎所有的分布质量都集中在[;\frac{\pi}{2};]附近，因此[;v_1;]与[;v_2;]正交。

2011-06-16 17:40:43

    念书时第一次听到这个结论，顿时目瞪口呆，随机性和高维结合起来居然有这么漂亮的结论，因为太过震撼，多年以后仍依稀记得，今天下午设计算法时再次用到，试着回想了一下证明过程，记于此。 
   
 查看公式，需要安装 
   插件。 
   
 在n维空间中，给定一个向量[;v_1;]，不妨假设其为最后一个单位向量，即（0,0……1），问：随机给定一个向量[;v_2;]，[;v_1;]与[;v_2;]正交的可能性有多大？ 
   
 因为两个向量正交与否与向量的长度无关，因此不妨设[;v_2;]为单位向量，并且采用球面坐标系，则[;v_2;] 
   
 可以用n-1个角度构成的向量来表示，即[;(a_1,...a_{n-1});]，则向量在此n-1维球面上呈现均匀分布意味着： 
   
 [;p(a_1,...a_{n-1})=\prod_{i=1}^{n-2}(sin a_i)^{n-i-1};] 
   
 此时[;a_1;]即为[;v_1;]和[;v_2;]的夹角，将上式对除[;a_1;]外的其他n-2变量求积分（需要注意，其中一个变量的积分范围为[;[0,2\pi];]，其他n-3个变量的积分范围都是[;[0,\pi];]），便得到： 
   
 [;p(a_1)=(sin a_1)^{n-2};]。 
   
 大家可以代入n=1000，画一下这条概率密度曲线，便会发现几乎所有的分布质量都集中在[;\frac{\pi}{2};]附近，因此[;v_1;]与[;v_2;]正交。