from sklearn import preprocessing #预处理模块
import numpy as np
均值移除
将数据跨度大(比如:[-1000,10,1000])的数据均值处理,处理到0和1左右,
mean 平均值
Std 标准差
data = np.array([[-1000,10,40],[10,300,10],[20,1,30]])
print(data)
[[-1000 10 40]
[ 10 300 10]
[ 20 1 30]]
result = preprocessing.scale(data) #0均值处理 中心化处理
print(result)
[[-1.41416209 -0.67445655 1.06904497]
[ 0.69663157 1.41371853 -1.33630621]
[ 0.71753052 -0.73926198 0.26726124]]
print(np.mean(result,axis=0)) # 列 约等于0 均值 ,axis=0是列 ,,axis=1是行
[-1.11022302e-16 -1.11022302e-16 -7.40148683e-17]
print(np.std(result,axis=0)) #列上约等于1 标准差
[1. 1. 1.]