1.方差与标准差都是用于衡量数据的离散程度,方差的层次是数据平方,而标准差则和数据同一量纲。
标准差和方差都是用来衡量样本离散程度的量,那么为什么要有标准差呢? 因为方差和样本的量纲不一样。换句话说不在一个层次,怎么理解这个层次,从公式来看方差是样本和均值差的平方和的平均。这里有一个平方运算,这是导致量纲不在一个层次的原因。而标准差和均值的量纲(单位)是一致的,在描述一个波动范围时标准差比方差更方便。
转载请附上原文出处链接及本声明。
2.协方差
方差和标准差适用于衡量一维数据,但是世界是以多维数据呈现的,,那么很自然就会想到现象和数据的相关程度,以及各维度间相关程度。
比如,一个产品卖的好不好有很多因素构成,比如产品质量,价格等。那么价格质量之间是否由相关性呢?这个问题就可以用协方差来解决。
公式
期望值分别为E(X), E(Y)的两个变量X,Y的协方差
Conv(X,Y)=E[(X−E(X))(Y−E(Y))]Conv(X,Y)=E[(X−E(X))(Y−E(Y))]
=E(XY)−2E(X)E(Y)+E(X)E(Y)=E(XY)−2E(X)E(Y)+E(X)E(Y)
=E(X协方差表示两个变量的总体的误差。这和只表示一个变量误差的方差不同。如果两个变量变化的趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身期望值。那么两个变量之间的协方差就是正。如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个小于自身期望值,那么这两个变量之间的协方差就是负值。如果X,Y之间是独立的,那么两者的协方差就是0。Y)−E(X)E(Y)=E(X协方差表示两个变量的总体的误差。