数据标准化,是对数据进行无量纲化的处理,即去除数据的度量单位。
1 基本原理:
在进行多指标研究分析时,由于多指标的度量不一致,其数据间的差值也会过大,如果直接用原始数据进行研究分析,则会导致结果呈现偏向(偏高或偏低作用),因此为了保证结果呈现真实的规律,需要对多指标进行数据标准化处理。
常用的数据标准化方法有:Z-Score标准化(Z得分)、最大最小值标准化和归一化标准化等。
2 融入方法论:
(1)如果指标数据集中存在异常值、不知道最大最小值、超出取值范围的离群值,则通过Z得分进行数据标准化。
(2)如果已知数据集的最大最小值(确认不会变化),则会通过最大最小值进行数据标准化。
(3)如果需要进行数据标准化的同时计算权重,则会通过归一化进行数据标准化。
3 公式:
(1)Z得分:
标准化数据=(原始值-均值)/标准差
(2)最大最小值:
标准化数据=(原始值-最小值)/(最大值-最小值)
(3)归一化: