数据预处理方法
scikit-learn模块
降维模块 Dimensionality reduction (decomposition)
数据预处理模块 Preprocessing
填补缺失值 impute
特征选择 feature_selection
数据无量纲化
数据归一化 normalization(preprocessing.MinMaxScaler)
通过 中心化(平移)缩放处理 ,MinMaxScaler参数 feature_range 默认参数[0,1],使得数据收敛到(0,1)
极易受异常值的影响
from sklearn.preprocessing import MinMaxScaler
import pandas as pd
data = [[-1,2],[-0.5,6],[0,10],[1,18]]
#实现归一化
scaler = MinMaxScaler(feature_range=[0,1])
result = scaler.fit_transform(data)
# 复原数据
scaler.inverse_transform(result)
作者:陈文瑜
链接:https://www.jianshu.com/p/bffe252d7056
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。