提到方差,一个命令var()。
方差定义用来度量随机变量和其数学期望(即均值)之间的偏离程度。
> a = sample(10)
> a
[1] 4 2 9 3 6 10 8 5 7 1
> var(a)
[1] 9.166667
是协方差。协方差定义用于衡量两个变量的总体误差,即描述两个变量之间的相对于各自的期望值的变化趋势。方差是协方差的一种特殊情况,即两个变量是同一个变量的情况。
> b = matrix(sample(20),4,5)
> b
[,1] [,2] [,3] [,4] [,5]
[1,] 10 12 8 17 20
[2,] 4 11 6 3 19
[3,] 15 1 2 13 16
[4,] 7 14 9 5 18
> cov(b)
[,1] [,2] [,3] [,4] [,5]
[1,] 22.000000 -21.666667 -9.333333 23.333333 -5.000000
[2,] -21.666667 33.666667 17.500000 -13.666667 7.833333
[3,] -9.333333 17.500000 9.583333 -4.166667 3.916667
[4,] 23.333333 -13.666667 -4.166667 43.666667 0.500000
[5,] -5.000000 7.833333 3.916667 0.500000 2.916667
协方差和相关系数又存在很大的区别。相关系数定义研究变量之间线性相关程度的量,即主要反映两个变量之间的线性关系,正相关或者负相关,通过相关系数R反映 (R值得范围-1~1&#