1. Z-Score标准化
对数据系列中的每一个数据点作减去均值并除以方差的操作,使得处理后的数据近似符合(0,1) 的标准正态分布:
xi∗=(xi−μ)/σx_i^*=(x_i-μ)/σ
优点:
1) 计算相对简单,在计算机编程软件中操作方便;
2) 能够消除量级为数据分析带来的不便,不受数据量级的影响,保证了数据间的可比性.
缺点:
1) 计算时需要得到总体的均值及标准差,在数据较多时难以实现,大多数情况下用样本均值及标准差代替,此举会导致分析结果与真实结果之间会存在差异;
2) 极大程度上改变了数据的原始意义,使得只能比较数据之间的关系,导致这种标准化方法的现实意义需要在比较中实现;
3) 对数据的相关性有要求,只有在数据大致符合正态分布时才能得到最佳结果.
适用范围:适