一组样本数据的数值特征一般来说可以从三个方面来描述:
-
数据的水平(也可以称之为集中趋势或位置度量),反映数据的数值大小
-
数据的差异,反映数据间的离散程度
-
数据的分布形状,反映数据分布的偏度和峰度
描述水平的统计量
数据水平是指数值大小,描述数据水平的统计量有平均数
,分位数
,众数
,同时这几个统计量也可以用来描述数据的集中趋势度。
平均数
**简单平均数(simple mean)**的公式:
x ˉ = x 1 + x 2 + x 3 + . . . + x n n = ∑ i = 1 n x i n \bar{x} = \frac{x_{1}+x_{2}+x_{3}+...+x_{n}}{n} = \frac{\sum_{i=1}^{n}x_{i}}{n} xˉ=nx1+x2+x3+...+xn=n∑i=1nxi
加权平均数(weighted mean):如果样本被分为K组,每组的组中值(组上限与下限的平均数)为m1,m2,…,mk表示各组的频数用f1,f2,…,fk表示,则样本平均数的计算公式为:
x ˉ = m 1 f 1 + m 2 f 2 + m 3 f 3 + . . . + m k f k f 1 + f 2 + f 3