计算和理解平均数:

  1. 计算均值(算数平均数)

    均值是计算平均数最常用的形式。等于数组中所有数值的总和除以该数组值的个数。

  2. 计算加权平均数

    简单计算的均值,如果出现极端值的情况,并不能反映整体数据的均值,那么我们就需要采用加权平均数。

    加权平均数:每一数值乘以它出现的频数,并将所有的积相加,然后除以频数的总和。

    1)列出要计算均值的样本的所有数值。

    2)列出每一个值出现的频数。

    3)每一数值乘以它的频数

    4)计算“数值*频数”列的所有数值总和。

    5)除以频数的总和。


  3. 计算中位数

    中位数定义为一系列数据的中点,中位数没有标准公式。

    1)以从小到大或者从大到小的顺序列出数据

    2)找到位于中间位置的数据。那就是中位数。

    均值是一系列数值的中间点,而中位数是一系列个体的中间点。

    因为中位数关注的是有多少个体而不是这些个体的数值,极值就不会产生影响。

  4. 计算众数

    众数是最笼统、最不精确的集中趋势量数。但是在理解特定的数据集的特征中扮演着非常重要的角色。

    众数就是出现次数最多的数值。仍然没有计算公式

    1)列出一个数据分布中的所有数值,但是每一个数值只列出一次。

    2)计算每个数值出现的次数。

    3)出现次数最多的就是众数。



何时使用那种测试类型:

  1. 如果数据属性是分类的,而且数值中只属于一种类型,例如头发颜色、政治背景、邻里位置和宗教,就使用众数。这种情况下各个分类之间是互斥的。

  2. 如果数据中包含而且你不想扭曲平均数就是用中位数,例如收入。

  3. 最后,如果数据不包括极值也不是分类数据就使用平均数,例如考试成绩或游五十码需要的时间。