数据预处理--标准化与归一化
对原始数据进行处理 , 有两种方法 :
- 1: 标准化standardization ( 或者叫做Z-score normalization ) , 均值 μ = 0 \mu=0 μ=0 , 标准差 σ = 1 \sigma=1 σ=1
- 2: 归一化Min-Max scaling ( 或者叫做normalization )
注意点:
1: 标准化和归一化代码:
from sklearn import preprocessing
# 标准化
std_scale = preprocessing.StandardScaler().fit( df[['A', 'B'...]] )
df_std = std_scale.transform( df[['A', 'B'...]] )
# 归一化
minmax_scale = preprocessing.MinMaxScaler().fit( df[['A', 'B'...]] )
df_minmax = minmax_scale.transform(df[['A', 'B'...]]