统计学的基本概念
样本的均值,方差,标准差。假设有一个含有n个样本的集合,这些概念的公式描述为
均值:
标准差:
方差:
均值描述的是样本集合的中间点(也称期望),标准差描述的是样本集合的各个样本点到均值的距离之平均。以两个集合为例,
A=[0,8,12,20]
B=[8,9,11,12]
两个集合的均值都是10,但显然两个集合的差别还是很大的,计算两者的标准差,前者是8.3,后者是1.8.显然后者较为集中,故其标准差小一些,标准差描述的就是这种散布度。之所以除以n-1而不是n,是因为这样能使我们以较小的样本集更好地逼近总体的标准差,即统计上所谓的无偏估计。而方差就是标准差的平方。
协方差
标准差和方差一般是用来描述一维数据的,