归一化
是什么?
在机器学习中, 归一化是一个重要的预处理步骤,归一化可以将所有的特征放到相同的尺度, 以确保他们具有相同的重要性。
为什么?
因为不同的特征之间的单位(量纲)可能不同,导致某些特征对模型的训练和预测产生更大的影响。
怎么实现?
具体来说,归一化的目的是将数据的值域缩放到一个固定的范围内, 通常是【0,1】或者【-1, 1】。这种缩放可以通过以下公式实现:
x
n
o
r
m
=
x
−
x
m
i
n
x
m
a
x
−
x
m
i
n
x_{norm} = \frac{x - x_{min}}{x_{max} - x_{min}}
xnorm=xmax−xminx−xmin
其中 x 是原始数据, x _min 和x_max是最大值, x_norm是经过归一化的数据。
标准化
是什么?
在机器学习中,标准化是一种常用的数据预处理方法,与归一化不同,标准化是一种基于特征的统计量,例如均值和标准差, 来缩放数据的方法。 标准化可以将数据转化为均值为0、方差为1的分布,这有助于减少离群值的影响,
为什么?
他的目的是将数据缩放到相同的尺度,去除异常值的影响,以便于模型的训练和优化。
怎么实现?
标准化的公式为:
x
s
t
d
=
x
−
μ
σ
x_{std} = \frac{x - \mu}{\sigma}
xstd=σx−μ
因此,归一化和标准化的主要区别在于他们所使用的缩放方法不同。
归一化可以确保数据在相同的尺度上,而标准化可以确保数据具有相同的分布。