1 标准化公式
( S a m p l e − m e a n ) s t d \frac{(Sample - mean)}{std} std(Sample−mean)
计算时对每个属性/每列分别进行
Sample
是一个(n_samples, n_features)
的数组,行代表有几组样本,列表示属性特征
2 利用np.mean
,np.std
进行计算
对其中一列属性进行计算并对比:
(Sample[:,0]-np.mean(Sample[:,0]))/np.std(Sample[:,0])
3 利用preprocessing.StandardScaler()
进行计算
scaler = preprocessing.StandardScaler().fit(Sample)
Sample_scaled = scaler.transform(Sample) #标准化后的数据
print(Sample_scaled[:,0])
结果是一致的!