1.偏态系数,以平均数和中位数之差对标准差之比率来衡量偏斜的程度。偏斜系数小于0,则平均数在众数之左,图形呈左偏,又称负偏。偏态系数大于0,平均数在众数之右,图形呈右偏,又称正偏。
S表示偏度;i 表示第 i个数值; 表示平均值; n是采样数量
2.峰态系数,衡量离群数据离群度的指标,与随机分布的四阶中心距对应,是数据序列的四阶中心距与标准差的四次幂之比。正态分布的峰度值为 3 ,称作常峰态,对应 I (beta=0);峰度值大于 3 被称作尖峰态,对应 II (beta>0);峰度值小于 3 被称作低峰态,对应 III (beta<0)。峰度系数越大,数据越集中。
一般来说,不希望峰度过大或过小,主要考虑因子的区分度和稳定性。峰度过大,观察值很集中,尾部短且薄,两端股票波动大,不稳定;峰度过小,类似均匀分布,缺少区分度。