提示:sklearn.preprocessing.RobustScaler(解释和原理,分位数,四分位差)
提示:以下是本篇文章正文内容,下面案例可供参考
一、RobustScaler 是什么?
RobustScaler 的居中和缩放统计基于百分位数,因此不会受到少数非常大的边缘异常值的影响。
计算公式如下(具体计算公式以官网提供的代码为准):
value_result = (value-Media)/(Q1-Q3)
Q1的位置 = 1 * (n + 1) / 4
Q3的位置 = 3 *(n + 1) / 4
n : 表示数据的个数。
media : 中位数
Q1 : 是第 1 个四分位数(第 25 个分位数)
Q3 : 第 3 个四分位数(第 75 个分位数)
二、代码
1.代码
import pandas as pd
from sklearn.preprocessing import RobustScaler
data = pd.DataFrame(
{
'a': [1, 2, 3, 4, 6, 5, 6],
'b':