数据分布特征可以从以下三个方面来描述:数据的水平,反应数据的集中程度;数据的差异,反应数据的离散程度;数据的分布形状,反应数分布的偏态和峰态。
1. 水平的度量
描述数据水平的统计量:平均数、中位数、分位数、众数。
1.1 平均数(均值)
1.1.1 概念
- 简单平均数
样本数据 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn,样本量n,则样本平均值为 x ‾ = ∑ 1 n x i n \overline{x}=\frac{\sum^{n}_{1}x_i{}}{n} x=n∑1nxi - 加权平均数
如果原始数据被分成k组,各组的组中值(上限值与下限值的简单平均)分别用 M 1 , . . . , M k M_1,...,M_k M1,...,Mk表示,各组的频数分布用 f 1 , . . . , f k f_1,...,f_k f1,...,fk表示,样本平均数为
x ‾ = ∑ i = 1 k M i f i n \overline{x}=\frac{\sum^{k}_{i=1}{M_if_i}{}}{n} x