理论铺垫
1)集中趋势
均值、中位数、众数,分位数
均值:常用来衡量一些分布规律、均匀的连续值
中位数:衡量有些异常值,有些特别大,特别小时
众数:用来离散值的集中趋势衡量
分位数:把数据从小到大排列,然后切分成等份的数据点,比较常用的是四分位数,和其他数共同作用,有时会有不同的效果
四分位数的计算方法 :
Q1的位置=(n+1)*0.25
Q2的位置=(n+1)*0.5
Q3的位置=(n+1)*0.75
2)离中趋势
标准差、方差
开方为标准差,不开方则为方差
值越大越聚拢,反之越离散