机器学习中归一化与标准化
1、归一化
在Python中使用归一化
from sklearn.preprocessing import MinMaxScaler
#实例化
mm = MinMaxScaler()
mm.fit_transform(x)
因为归一化易受异常点的影响,一般使用较少
2、标准化
在Python中使用标准化
from sklearn.preprocessing import StandarScaler
#实例化
ss = StandarScaler()
ss.fit_transform(x)
3、PCA 主成分分析
当样本特征过多时,使用主成分分析可以减少特征的数量,并且尽可能的保留原有的信息。
PCA(n_components=0.9) # 表示保留原有信息的90%,通常使用90%~95%