标准化的目的与归一化一样,都是为了避免某个特征的重要程度过大或过小。
标准化的优点:受异常点的影响较小。 适用于繁杂大数据。
demo.py(scikit-learn,数据的预处理,标准化,StandardScaler):
from sklearn.preprocessing import StandardScaler
# 标准化处理
std = StandardScaler()
# (fit_transform()等同于fit()填充数据 + tansform()转换数据)(tansform转换器转换数据时所依赖的均值、标准差等取决于fit()填充的数据)
data = std.fit_transform([[ 1., -1., 3.],[ 2., 4., 2.],[ 4., 6., -1.]])
print(std.mean_) # [2.33333333 3. 1.33333333] 每列的平均值
print(data)
'''
[[-1.06904497 -1.35873244 0.98058068]
[-0.26726124 0.33968311 0.39223227]
[ 1.33630621 1.01904933 -1.37281295]]
'''