数据标准化:是指将数据按比例缩放,使之落入到特定区间
1 进行0-1 表转化计算公式
使用环境: 在聚类分析,主成分分析的时候,因为量纲不一所以需要
#导入归一化方法
from sklearn.preprocessing import MinMaxScaler
mms = MinMaxScaler()
#调用方法对数据进行归一化处理
data['X_train'] = mms.fit_transform(data['X_train'])
X_train :需要做归一化处理的数据列、或者数据框
2 正态标准化
使用环境:线性回归需要数据呈现正态分布趋势、其他的聚类等及机器学习的场景
from sklearn.preprocessing import StandardScaler
stdsc=StandardScaler()
iris_data=stdsc.fit_transform(iris_data)
iris_data:需要做正态标准化处理的数据列、或者数据框