方差(Variance)
方差用于衡量随机变量或一组数据的离散程度,方差在在统计描述和概率分布中有不同的定义和计算公式。
①概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度;
②统计中的方差(样本方差)是每个样本值与全体样本均值之差的平方值的平均数,代表每个变量与总体均值间的离散程度。
概率论中计算公式
离散型随机变量的数学期望:
连续型随机变量的数学期望:
其中, p i pi pi是变量, x i xi xi发生的概率, f ( x ) f(x) f(x)是概率密度。
统计学中计算公式
总体方差,也叫做有偏估计,其实就是我们从初高中就学到的那个标准定义的方差:
其中,n表示这组数据个数,x1、x2、x3……xn表示这组数据具体数值。
其中, X ˉ \bar{X} Xˉ为数据的平均数, n n n为数据的个数, s 2 s^{2} s2为方差。
样本方差,无偏方差,在实际情况中,总体均值\bar{X}是很难得到的,往往通过抽样来计算,于是有样本方差,计算公式如下
为什么分母变成了n-1
协方差(Covariance)
协方差在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
其中,E[X]与E[Y]分别为两个实数随机变量X与Y的数学期望,Cov(X,Y)为X,Y的协方差。
标准差(Standard Deviation)
标准差也被称为标准偏差,在中文环境中又常称均方差,是数据偏离均值的平方和平均后的方根&#x