平均数(average) 又叫集中趋势量数,是能够最好地代表一组数据的数值。
平均数一般有3种形式:均值,中位数,众数。
均值(mean):所有数值的总和除以数值个数。
(1+2+3+4+5)/5 = 3 均值为3
均值对极大极小的数值很敏感,这会导致均值被稀释
如: (1+2+3+4+100)/5 = 22
中位数(median):一系列数据的中点。
如果数据项为奇数,取中间那个数值
如果数据项为偶数,中间两个数值相加后除2
如: 1,2,3,4,5 中位数为3
1,2,3,4,5,6 中位数为 (3+4)/2 中位数为3.5
众数(mode):出现次数最多的数。
可用来统计立场,如投票等。
如 : 1,2,3,4,5,6,3,2,3
3出现次数最多,众数为3
何时使用:
- 如果数据属性是分类的,而且数值只属于一种类型,例如头发颜色、政治背景、投票等,就使用众数。
在这种情况下各个分类之间是互斥的。 - 如果数据中包含极大或极小的数值,而你又不想扭曲平均数,那就使用中位数,例如收入。
- 如果数据不包含极大极小值,也不是分类数据,那就使用均值,例如考试成绩。