规范化处理,缓解特征共线性问题
from sklearn.preprocessing import *
#数据规范化处理
raw=data.iloc[:,4:10]
zraw1=StandardScaler(copy=True,with_mean=True, with_std=True).fit_transform(raw)#z变换,with_std=False对中处理
zraw2=MinMaxScaler(feature_range=(0,100)).fit_transform(raw)#归一化及任意区间的线性变换,逻辑回归
zraw3=RobustScaler(quantile_range=(25.0, 75.0),with_centering=True,with_scaling=True).fit_transform(raw)#稳健变换,右偏数据
zraw4=Binarizer(threshold=0).transform(zraw1)#二值变换,大于threshold值的赋值1,其他为0,图像数据
zraw5=normalize(raw,norm='l1',axis=1)#特征归一化,l1表示L1范数(曼哈顿聚类,L2是欧式距离),axis=1表示行的绝对值和为1;
zraw6=np.log(raw)#另外见PowerTransformer()
主成因分析
#============主成分分析============&