个人理解是为了使数据集中每列数据(也就是每个特征数据)都统一标准化。即:采用Z-Score规范化数据,保证每个特征维度的数据均值为0,方差为1
注意: fit_transform 之前的数据集 train_X可以是二维的列表,也可以是pandas.DataFrame类型,fit_transform 之后的train_XX 数据类型是二维的umpy.ndarray
from sklearn.preprocessing import StandardScaler
ss = StandardScaler()
train_XX = ss.fit_transform(train_X)
参考:
https://blog.csdn.net/weixin_30271335/article/details/98907327