数据特征之间往往有着不同的分布区间,差异较大的情况下会很大程度的影响数据分析的结果。为了消除这种现象的影响需要对原始数据进行归一化处理,使得各个指标处于同一数量级。
(1)max-min归一化
也叫离差标准化,是对原始数据的线性变换,使结果值映射到[0 - 1]之间。公式为:
X=(X-min)/(max-min)
max:最大值,min:最小值。
(2)Z-score标准化
这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1。公式为:
X=(X-u)/t
u:均值,t:标准差
数据归一化的方法
最新推荐文章于 2022-07-28 18:05:22 发布