- 参考博文1
详解马氏距离中的协方差矩阵计算(超详细)
注意事项:在概率问题中,其中的方差、协方差啥的底数都需要改为n。举的例子是已知所有数据的,是属于概率问题,那么底数是n,故3需要改成4才对。 - 参考博文2
Python3学习(六十二):方差、标准差和协方差三者之间的定义与计算
注意事项:(引用博主的话)
ddof = 0 参数的说明
- 如果你从网上
查找方差的公式,你会发现有2个公式!
那么哪个是正确的呢?又有什么区别呢? - 在上面的方差公式和标准差公式中,存在一个值为N的分母,其作用为将计算得到的累积偏差进行平均,从而消除数据集大小对计算数据离散程度所产生的影响。不过,使用N所计算得到的方差及标准差只能用来表示该数据集本身(population)的离散程度;如果数据集是某个更大的研究对象的样本(sample),那么在计算该研究对象的离散程度时,就需要对上述方差公式和标准差公式进行贝塞尔修正,将N替换为N-1:
- 简单的说,是
除以 N 还是 除以 N-1,则要看样本是否全
,比如,我要统计全国20岁男性的平均身高,这时间你肯定拿不到全部20岁男性的身高,所以只能随机抽样 500名,这时间要除以 N-1,因为只是部分数据;但是我们算沪深300在2017年3月份的涨跌幅,我们是可以全部拿到3月份的数据的,所以我们拿到的是全部数据,这时间就要除以 N。
结果:
python的numpy库中,默认的np.cov()求出来的是协方差矩阵,默认的np.cov()[1][0]求出来是按照底数n-1求解的协方差值。