大部分的数据分析都希望原始数据是满足正态分布的定距变量。然而,显示是残酷的,在各种研究中,常常需要面对非正态分布的定距数据。为了解决数据的正态性问题,数学家们总结了很多转化方法,但是没有万能神药,都需要对症下药(根据数据的实际分布情况,选择合适的转化方法)。
下面不会介绍具体的转化方法,只是帮助大家理顺正态转化的思路,明白正态转化的逻辑,不至于将正态转化看做神秘领域,高不可攀。
正态转化四步骤
第一步:计算数据的分布状况及两个参数:偏度(Skewness)和峰度(Kurtosis)。
第二步:根据变量的分布形状和参数,决定是否做转换。
1、对称判断
看Skewness(偏差度)的取值。如果偏