sklearn.preprocessing.RobustScaler缩放有离群值的数据
sklearn.preprocessing.RobustScaler(with_centering=True, with_scaling=True, quantile_range=(25.0, 75.0), copy=True)
使用具有鲁棒性的统计量缩放带有异常值(离群值)的数据
该缩放器删除中位数,并根据百分位数范围(默认值为IQR:四分位间距)缩放数据。 IQR是第1个四分位数(25%)和第3个四分位数(75%)之间的范围。数据集的标准是通过去除均值,缩放单位方差来完成,但是异常值通常会对样本的均值和方差造成负面影响,当异常值噪声很大时,用中位数和四分位数范围通常时候产生更好的效果。
Parameters(参数):
with_centering : 布尔值,默认为True
如果为True,则在缩放之前将数据居中。若使用稀疏矩阵时,这将导致转换引发异常,因为将它们居中需要建立一个密集的矩阵,在通常的使用情况下,该矩阵可能太大而无法容纳在内存中。
with_scaling : 布尔值,默认为True
如果为True,则将数据缩放到四分位数范围。
quantile_range : tuple (q_min, q_max), 0.0 < q_min < q_max &l