为什么要进行特征归一化?
不同的特征往往具有不用的量纲和量纲单位,为了消除指标之间的量纲影响,解决数据指标之间的可比性。
三种归一化:
1)线性比例变换:
2)极差变换法(离差标准化):
缺点:(1)当有新数据加入时,会导min(x)和max(x)的变化,需要重新定义。
(2)存在极端的最大值或者最小值。
适用于数据量较小的工程。
3)0均值标准化(Z-score方法)
适用于服从正态分布的数组
为什么要进行特征归一化?
不同的特征往往具有不用的量纲和量纲单位,为了消除指标之间的量纲影响,解决数据指标之间的可比性。
三种归一化:
1)线性比例变换:
2)极差变换法(离差标准化):
缺点:(1)当有新数据加入时,会导min(x)和max(x)的变化,需要重新定义。
(2)存在极端的最大值或者最小值。
适用于数据量较小的工程。
3)0均值标准化(Z-score方法)
适用于服从正态分布的数组