java盒图_盒须图简介 - Java报表工具技术讨论,Style Report 报表专题 - OSCHINA - 中文开源技术交流社区...

盒须图(Boxplot)主要用于对数据分布的显示。对于详细数据的显示通常采用下面几种方法。

最简单的方法是把所有的数据显示在一个散点图上。读者可以直接观察数据点的分布。

d2a0c1f89f5b1834ec1375b4564acea4.png

但如果数据量很大,数据点就会大量的重叠。虽然可以采用一些方法来减少重叠的影响,比如抖动,半透明显示等措施,但当数据量达到一定规模之后,唯一可行的方式就是显示数据汇总之后的结果。

比如在上面的例子,我们显示了一组销售价格和年度的数据。如果我们想看看总体价格是在上升或者下降,最常用的方法就是显示每个年度的均价。

ba69fa45b5747600aa013ceee91d76b7.png

根据年度均价的显示,销售价格应该是一个下降的趋势。但是真实情况确实如此吗?在使用平均值的时候,有很多情况会引起对数据的曲解。比如房价,如果高价位的房降了10%,而中低价位的房涨了15%,得出的均价很可能显示一个下降的趋势。而大家的感觉却是房价在上涨。

盒须图在很大程度避免了这种问题。盒须图对每组数据显示了五个部分:

e48452eea51e3e393253079f1161294f.png

以从上到下的顺序:

最大值(或减掉outlier之后的最大值)

位于75%百分位的值

中间值

位于25%百分位的值

最小值

如果我们不上面例子里的同样数据用Boxplot画出来,就可以看到一个完全不同的结果。

d3daeb278ba9beed264efb9bb177d52c.png

我们可以看到和2009年相比,2010年的最低价位到中高价位都有一个上升。但因为最高值有一个较大的下降,导致平均值有一个降低。但总体价位是一个上升的趋势。

相关资源:箱型的实现
已标记关键词 清除标记
表情包
插入表情
评论将由博主筛选后显示,对所有人可见 | 还能输入1000个字符
相关推荐
©️2020 CSDN 皮肤主题: 1024 设计师:白松林 返回首页