本文内容参考来源:billiontrader.com/2016/08/04/measures-of-variability
假设一笔投资的回报情况是第一周盈利1元,第二周盈利10元,第三周盈利100元,那么每周盈利的均值=(1+10+100)/3=37元。
在这里,均值体现的是收益率分布的中心在哪里,但并没有体现出收益率的分布差异程度。因此在衡量一组数据的分布情况时,不能只看数据的集中程度,为了量化该组数据中某一具体数值分布的精确度以及与其他数据的分布偏离程度,需要借助一些衡量数据分布差异性的指标。
数据区间
数据区间是指该组数据中最大值和最小值之间的距离。
比如有三组数据:
1、(1,1,1)
2、(1, 1,2)
3、(1,2,3,4,5,100)
第一组数据分布的差异程度为1-1=0;第二组数据分布的差异程度为2-1=1;第三组数据分布的差异程度为100-1=99。在第三组数据中,分布差异最大的是100-1的99,但99并不代表第三组中各数据之间一般的分布情况,因此数据区间只体现数据组中最大值和最小值之间的差异程度而没有考虑数据分布的集中趋势。
均值偏差
均值偏差是指一组数据中各数据与均值之间的差异程度。
以下是另两组数据:
1、(5,5,5)
2、(6, 7,1,6,5)
这两组数据的均值均为(5+5+