一、平均数、方差、标准差、协方差、协方差矩阵的概念
1、平均数
- 含义:反映数据集中趋势的一项指标
- 计算公式:指在一组数据中所有数据之和再除以数据的个数
2、方差
- 含义:衡量随机变量及其数学期望(即均值)之间的偏离程度。
- 计算公式:各个数据与数学期望之差的平方之和,再除以这组数据的个数。
即为:
3、标准差
- 含义:反映一个数据集的离散程度,平均数相同的两组数据,标准差未必相同。
- 计算公式:方差的算术平方根(很多帖子写错了,是算术平方根)。
标准差与方差的关系:方差=标准差的平方
4、协方差
- 含义:衡量两个变量之间的变化方向关系,即衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。
- 计算公式:
这里的x,y是两组数据Data1(x)和Data2(y),是二维的,也就是说两组数据之间存在某种关系。
5、协方差矩阵
- 含义:协方差矩阵可用来表示多维随机变量的概率密度,从而可通过协方差矩阵达到对多维随机变量的研究
- 计算公式:
二、实际举例
eg:现有两组数据x,y,每组数据有6个,所以x,y分别有自己的均值、方差、标准差,而两组数据之间存在某种关系,所以就存在协方差cov(x,y)。
1、平均数的计算
很容易两组数据x,y的均值分别为:
2、方差的计算
两组数据x,y的方差分别为:
3、标准差的计算
两组数据x,y的标准差计算公式为:
4、协方差的计算
两组数据x,y的协方差计算公式为:
5、协方差矩阵
三、特别注意
以上的数据x,y都是总体,如果是样本的话,因为不是总体,在计算方差、标准差和协方差时,经过校正计算公式分母必须时n-1。
如:
- 方差:
- 标准差:
- 协方差:
在统计工作中,平均数(均值)和标准差是描述数据资料集中趋势和离散程度的两个最重要的测度值。