第二章:集中趋势的度量
术语:
1.均值:将所有数字加起来,然后除以数字个数。但是这不等于平均数,因为平均数有很多种。
Σx=x1+x2+…+xn
μ=Σx/n
μ=Σfx/Σf(每个数字乘以其频数)/(频数和)
异常值:与其他数据格格不入的极高或极低的数值
偏斜数据:当异常值将数据向左或向右“拉”时,即产生偏斜数据
2.中位数:处于中间,即中间值。(另一种平均数)
3.众数:频数最大的数值。
要点:
1.求出平均值是把握全局的第一步。
2.中位数计算方法:奇数个数字时,取中间位置的数字;偶数个数字时,取中间两个数字,再除以2。
3.当均值发生偏斜时,使用中位数。
4.众数必须存在于数据集中,唯一可以用于类别数据的平均数。
5.当众数很多时,众数就失去了意义。
统计量能够提供信息,但也能造成误导,因此针对不同的场景,应选取适合的统计量。