在对数据进行比较的时候,我们通常会使用直方图、饼图、折线图来对数据差异进行显化,而箱形图很少出现在我们的视野中。
今天在看代码的时候看到箱形图觉得很有意思
那么箱形图的价值在哪里?
我觉得最大的优点就是不受异常值的影响,可以以一种相对稳定的方式描述数据的离散分布情况。
有一个博主的博客里面的一张介绍箱型图的图很直观:
(转自:箱形图(python画箱线图))
而其中补充的一点就是:一般异常值用⭕表示,偏激异常值用 * 表示
对于Q1和Q3的值,这里举个例子就是:
上面的为Q1,下面的为Q3。
而四分位距IQR=Q3-Q1
上限=(Q3+1.5IQR,max)取最小,下限=(Q1-1.5IQR ,min)取最大。