只总结不证明。
1,相关系数实质上是向量夹角余弦。
2,协方差矩阵矩阵是实对称矩阵。如果随机变量们线性无关的话,它们就可以看做一组基,所以此时,协方差矩阵实质上是度量矩阵。如果两个随机变量独立,那么它们正交,一组正交的单位向量是标准正交基,标准正交基的度量矩阵是单位矩阵。因之,一组两两独立的、方差均等于1的随机变量,它们的协方差矩阵是单位矩阵。
3,实数域上的度量矩阵是正定的,这可以推出柯西不等式来。
3,相关系数在数据挖掘的表现形式为:
b | 非b | |
a | f(1,1) | f(1,0) |
非a | f(0,1) | f(0,0) |
[f(1,1)f(0,0)-f(0,1)f(1,0)]/根号下[f(1,*)f(*,1)f(0,*)f(*,0)]
其中f(1,*)=f(1,1)+f(1,0)。其他同理。
4,内积在欧几里得空间里变现形式为分量相乘的和。 在希尔伯特空间里表现为相乘函数的积分。在概率论里表现为协方差。因之,三个领域均有对应的Cauchy–Schwarz inequality