“平均”这个术语是统计中使用最频繁的指标,但它并不总是具有相同的意义,今天我们一起聊聊几种“平均数”。
一、均值、中位数、众数
- 均值是我们大多数时候所说的平均数,它的定义如下:
均 值 = 所 有 数 值 的 总 和 所 有 数 值 的 个 数 总 和 均值=\frac{所有数值的总和}{所有数值的个数总和} 均值=所有数值的个数总和所有数值的总和 - 中位数是分类数据组中间值(如果数据个数为偶数,则是两个中间数值和的一半)。
- 众数是数据组中出现次数最多的值(或者一组数)。
在统计计算中的舍入保留规则:
通常相对于原始数据而言,应该多保留一位小数。
- 例如:给定的数据为整数形式,那么应该将均值保留到十分位。给定的数据保留一位小数,那么应该将均值保留到百分位。
举例:对于某种商品的售价分别为1.09,1.29,1.29,1.35,1.39,1.49,1.59,1.79共8个价格。
- 均值
M e a n = 1.09 + 1.29 + 1.29 + 1.35 + 1.39 + 1.49 + 1.59 + 1.79 8 = 1.41 Mean=\frac{1.09+1.29+1.29+1.35+1.39+1.49+1.59+1.79}{8}=1.41 Mean=81.09+1.29+1.29+1.35+1.39+1.49+1.59+1.79=1.41
- 中位数
M e d i a n = 1.35 + 1.39 2 = 1.37 Median=\frac{1.35+1.39}{2}=1.37 Median=21.35+1.39=1.37
- 众数:1.29的数量最多
M o d e = 1.29 Mode=1.29 Mode=1.29
根据舍入保留法则,均值为1.410,中位数为1.370。
二、异常数
异常数是指一个比几乎比其他所有数值都要大很多或者小很多的数值。
异常值通常会影响均值,但对中位数和众数不受影响。
项目 | 是否常用 | 存在性 | 是否都参与运算 | 是否受异常值影响 | 优点 |
---|---|---|---|---|---|
均值 | 大多数 | 总是存在 | 是 | 是 | 通俗易懂,对于很多统计方法效果很好 |
中位数 | 经常 | 总是存在 | 否 | 否 | 当异常值存在时,比均值更具有代表性 |
众数 | 偶尔 | 可能没有,可能一个,也可能多个 | 否 | 否 | 适用于定性数据 |
三、加权平均值
加权平均值时对变量在数值中重要程度的解释。每个数值都被赋予一个权重。
加 权 平 均 值 = ∑ ( 数 值 ∗ 权 重 ) ∑ 权 重 加权平均值=\frac{\sum(数值*权重)}{\sum权重} 加权平均值=∑权重∑(数值∗权重)
举例:数学最终成绩基于两次小测验,一次期中考试和一次期末考试。小测的权重为10%,期中的权重为30%,期末的权重为50%。假如你的两次小测的成绩分别是80和86,期中的成绩为90,期末的成绩为95,那么最终成绩是多少呢?
根据公式,我们可以得出:
加 权 平 均 值 = ( 80 ∗ 10 + 86 ∗ 10 + 90 ∗ 30 + 95 ∗ 50 ) 10 + 10 + 30 + 50 = 93.1 加权平均值=\frac{(80*10+86*10+90*30+95*50)}{10+10+30+50}=93.1 加权平均值=10+10+30+50(80∗10+86∗10+90∗30+95∗50)=93.1
那么最终成绩是由不同成绩加权得来,最终为93.1分。
某一指标的权重是指该指标在整体评价中的相对重要程度。权重表示在评价过程中,是被评价对象的不同侧面的重要程度的定量分配,对各评价因子在总体评价中的作用进行区别对待。事实上,没有重点的评价就不算是客观的评价。