四分位距通常是用来构建箱形图,以及对概率分布的简要图表概述。对一个对称性分布数据(其中位数必然等于第三四分位数与第一四分位数的算术平均数),二分之一的四分差等于绝对中位差(MAD)。中位数是集中趋势的反映。 [1]
公式:IQR = Q3 − Q1
光说不练空把式
来看一个官网的例子🌰 链接: link
每列的特征中位值不难理解 [1,1,2]
但是scale(The (scaled) interquartile range for each feature in the training set.) 为什么是 [3,1.5,2.5]呢
其实是因为官网例子给的training set 长度为3,因此没法直接算四分位距。但我们可以根据公式近似:
以第一列为例:
第一列样本为[1, -2, 4]
IQR =(4 - (-2)) * 3/4 - (4 - (-2)) * 1/4 = 3
以上就是本期的全部内容,如果你看到这里,别忘了关注点赞