一、求中间值
对于一堆数的中间值有很多种方法:
1、mean,也就是average,求平均数
2、median,就中位数,将数排序,找出中间的数据,如果是偶数,中间的两个数平均
3、mode,众数。频率出现最多。
4、mid-range。range=maz-min,就是最大值减去最小值,数分布的范围。而mid-rand则是(max+min)/2,就是范围的中间值。
这说明用不同方式求中间值,有不同结果,很可能会出现误导。例如在平均收入上,mean和media就可以有很大的差距。
二、统计图
介绍了不同统计图所适合的场景
1)象形图
2)柱状图;3)线形图;4)饼图;
5)折线图
有时刻度不同会带来错觉,放在同一图中可以避免scale带来的误导。
6)茎叶图
Stem-leaf,stem表示不同的层次,leaf表示层次中的数据。例如一支篮球队球员的得分数,可以更具十位数划分不同的层次,stem中的0,1,2,表示球员的得分个位数的数值,得1x分或者2十几分。leaf,则表示具体的个位数分值。
7)盒须图 Box-and-whisher
这种图我们比较少使用,不会被均值的方式所误导。将数据范围4个Quarter,每个Q的样本数相同,先找出median,例如此图中的21,再找出前一半的median(14),和后一半的meida(33)。我觉得采用这种方式算平均收入才准确,不会因为二八原则,求均得到与实际感觉完全不同的数值。
相关链接:我的四方书库