一维数据的数字特征
表示位置的数字特征
众数(Mode)
是一组数据中出现次数最多的变量值,适合于数据量较多时使用,它不受极端值的影响。
均值(Mean)
:即是 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn的平均数,它描述了数值型数据取值的平均位置。
x ‾ = 1 n ∑ i = 1 n x i \overline{x}=\frac{1}{n}\sum_{i=1}^{n} x_i x=n1i=1∑nxi
当数据中存在异常值时,它缺乏抗扰性,即易受异常值的影响而使其值有较大的变化。抗扰性在统计学中也成为稳健性。
排序(Sort)
:设 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn是 n n n个样本观测值,将它们从小到大记为 x ( 1 ) , x ( 2 ) , . . . . , x ( n ) x_{(1)},x_{(2)},....,x_{(n)} x(1),x(2),....,x(n),即
x ( 1 ) ≤ x ( 2 ) ≤ . . . ≤ x ( n ) x_{(1)} \leq x_{(2)} \leq ... \leq x_{(n)} x(1)≤x(2)≤...≤x(n)
称它们为次序统计量,其中第 i i i个次序统计量的值是 x ( i ) x_{(i)} x(i)。特别地,最小次序统计量值 x ( 1 ) x_{(1)} x(1)与最大次序统计量值 x ( n ) x_{(n)} x(n)分别为: x ( 1 ) = min 1 ≤ i ≤ n x i x_{(1)}=\min_{1 \leq i \leq n} x_i x(1)=min1≤i≤nxi, x ( n ) = max 1 ≤ i ≤ n x i x_{(n)}=\max_{1 \leq i \leq n} x_i x(n)=max1≤i≤nxi。
中位数(Median)
:中位数(Meidan)的计算公式:
M e = { x ( n + 1 2 ) n 为奇数 1 2 ( x ( n 2 ) + x ( n 2 + 1 ) ) n 为偶数 M_e=\left\{ \begin{aligned} x_{(\frac{n+1}{2})} & & n为奇数 \\ \frac{1}{2}(x_{(\frac{n}{2})}+x_{(\frac{n}{2}+1)}) & & n为偶数 \end{aligned} \right. Me=⎩
⎨
⎧x(2n+1)21(x(2n)+x(2n